Запустили bounding box сервис по распознаванию и разметке объектов на изображениях

Bounding box сервис по распознаванию и разметке объектов на изображениях

Запустили bounding box сервис по распознаванию и разметке объектов на изображениях.

Метод bounding box может использоваться для аннотирования различных объектов или границ на изображении.

Статья описывает процесс взаимодействия с API.

Bounding box

Что такое bounding box? Bounding box - это прямоугольный контур вокруг объекта или нужной области на изображении. Этот метод часто используется для аннотирования изображения в целях машинного обучения.

Область применения

Bounding box обычно используется для аннотирования изображений в проектах машинного обучения, в частности в области компьютерного зрения, для решения таких задач, как обнаружение объектов и классификация изображений.

Аннотатор или маркировщик формирует прямоугольник вокруг объекта или нужной области на изображении создавая ограничительную рамку. Прямоугольная граница устанавливается с помощью методов маркировки данных. Затем для ее определения обычно используются два набора координат x и y.

Фигуры обозначают местоположение и границы объектов на изображениях. Они могут использоваться для различных типов объектов, таких как люди, животные, автомобили, здания и т.д. Некоторые объекты могут быть лучше представлены, если повернуть ограничительные рамки в соответствии с их формой. Это называется oriented bounding box и является особенностью некоторых инструментов разметки. Bounding box могут иметь и другие типы меток, такие как классы и атрибуты. Классы используются для наименования объекта, а атрибуты - для описания его специфических особенностей.

Bounding box полезны для обучения и тестирования моделей машинного обучения, позволяющих обнаруживать объекты на изображениях. Такие модели, например YOLO, обучаются на базе изображений с bounding box метками. Затем они могут предсказывать границы и метки для других изображений, которые они раньше не обрабатывались.

В области компьютерного зрения bounding box играют важную роль в задачах обнаружения и локализации объектов. Рисуя прямоугольные рамки вокруг интересующих объектов на изображениях, аннотаторы предоставляют явную информацию о местоположении и размерах объектов. Разметка служит обучающим набором для моделей машинного обучения, позволяя точно идентифицировать и классифицировать объекты на изображениях.

Bounding box и обнаружении объектов

Что такое обнаружение объектов? Целью обнаружения объектов является поиск и маркировка конкретных типов объектов (например, людей, зданий или автомобилей) на фотографиях и видео с помощью компьютерного зрения и обработки изображений - компьютерных технологий, позволяющих анализировать и обрабатывать визуальные данные.

Обнаружение объектов - это задача из ниши машинного обучения. Чтобы научиться определять объекты на изображениях, моделям искусственного интеллекта необходимы большие массивы данных изображений, на которых объекты аннотированы с помощью bounding box. Нарисовать рамку вокруг каждого объекта на изображении - это один из способов облегчить обнаружение объектов

Аннотации с bounding box помогают моделям классифицировать изображения и обнаруживать на них объекты.

Используя большой и точный набор данных с размеченными изображениями системы машинного обучения могут автоматически определять закономерности.

Сервис обучения алгоритмов машинного обучения для обнаружения объектов

Быстрый сервис обучения алгоритмов машинного обучения для обнаружения объектов

Сервис 2Captcha предлагает API для разметки изображений.

Разметка изображений выполняется в соответствии с требованиями закзачика и чаще всего заключается в рисовании рамки как можно ближе к краям искомых объектов.

Сервис помогает обнаруживать объекты, аннотируя bounding box рамки вокруг интересующих объектов с высокой точностью и скоростью.

Используя наше решение, вы можете строить современные модели компьютерного зрения на основе machine learning.

API

Bounding Box image

Метод bounding box можно использовать для решения задач, в которых вам нужно выбрать определенный объект или нарисовать рамку вокруг объекта, показанного на изображении, а также для разметки данных.

Поддерживаемые форматы изображений: JPEG, PNG, GIF
Максимальный размер файла: 600 kB
Максимальный размер изображения: 1000px с любой стороны

Спецификация для типа задачи BoundingBoxTask

Свойство Тип Обязателен Описание
type Строка Да Тип задачи: BoundingBoxTask
body Строка Да Изображение закодировано в формат Base64. Также поддерживается формат Data-URI (содержащий префикс data:content/type)
comment Строка Да* Работникам будет показан комментарий, который поможет им правильно разгадать капчу.
Свойство comment обязателено, при отсутствии свойства imgInstructions.
imgInstructions Строка Да* Необязательное изображение с инструкцией, которое будет показано работникам. Изображение должно быть закодировано в формат Base64. Максимальный размер файла: 100 кБ.
Свойство imgInstructions обязателено, при отсутствии свойства comment.

Пример запроса

Метод: createTask
Конечная точка API: https://api.2captcha.com/createTask

{
    "clientKey":"YOUR_API_KEY",
    "task": {
        "type":"BoundingBoxTask",
        "body":"/9j/4AAQSkZJRgABAQAAAQ..HIAAAAAAQwAABtbnRyUkdCIFhZ.wc5GOGSRF//Z",
        "comment":"draw a tight box around the green apple"
    }
}

Пример ответа

{
    "errorId": 0,
    "status": "ready",
    "solution": {
        "bounding_boxes": [
            {
                "xMin": 310,
                "xMax": 385,
                "yMin": 231,
                "yMax": 308
            }
        ]
    },
    "cost": "0.0012",
    "ip": "1.2.3.4",
    "createTime": 1692863536,
    "endTime": 1692863556,
    "solveCount": 1
}

Ссылки

Дополнительная информация:

Подробная информация о методе bounding box опубликована на странице API.