Запустили bounding box сервис по распознаванию и разметке объектов на изображениях

14.11.2023

Запустили bounding box сервис по распознаванию и разметке объектов на изображениях.

Метод bounding box может использоваться для аннотирования различных объектов или границ на изображении.

Статья описывает процесс взаимодействия с API.

Bounding box

Что такое bounding box? Bounding box - это прямоугольный контур вокруг объекта или нужной области на изображении. Этот метод часто используется для аннотирования изображения в целях машинного обучения.

Область применения

Bounding box обычно используется для аннотирования изображений в проектах машинного обучения, в частности в области компьютерного зрения, для решения таких задач, как обнаружение объектов и классификация изображений.

Аннотатор или маркировщик формирует прямоугольник вокруг объекта или нужной области на изображении создавая ограничительную рамку. Прямоугольная граница устанавливается с помощью методов маркировки данных. Затем для ее определения обычно используются два набора координат x и y.

Фигуры обозначают местоположение и границы объектов на изображениях. Они могут использоваться для различных типов объектов, таких как люди, животные, автомобили, здания и т.д. Некоторые объекты могут быть лучше представлены, если повернуть ограничительные рамки в соответствии с их формой. Это называется oriented bounding box и является особенностью некоторых инструментов разметки. Bounding box могут иметь и другие типы меток, такие как классы и атрибуты. Классы используются для наименования объекта, а атрибуты - для описания его специфических особенностей.

Bounding box полезны для обучения и тестирования моделей машинного обучения, позволяющих обнаруживать объекты на изображениях. Такие модели, например YOLO, обучаются на базе изображений с bounding box метками. Затем они могут предсказывать границы и метки для других изображений, которые они раньше не обрабатывались.

В области компьютерного зрения bounding box играют важную роль в задачах обнаружения и локализации объектов. Рисуя прямоугольные рамки вокруг интересующих объектов на изображениях, аннотаторы предоставляют явную информацию о местоположении и размерах объектов. Разметка служит обучающим набором для моделей машинного обучения, позволяя точно идентифицировать и классифицировать объекты на изображениях.

Bounding box и обнаружении объектов

Что такое обнаружение объектов? Целью обнаружения объектов является поиск и маркировка конкретных типов объектов (например, людей, зданий или автомобилей) на фотографиях и видео с помощью компьютерного зрения и обработки изображений - компьютерных технологий, позволяющих анализировать и обрабатывать визуальные данные.

Обнаружение объектов - это задача из ниши машинного обучения. Чтобы научиться определять объекты на изображениях, моделям искусственного интеллекта необходимы большие массивы данных изображений, на которых объекты аннотированы с помощью bounding box. Нарисовать рамку вокруг каждого объекта на изображении - это один из способов облегчить обнаружение объектов

Аннотации с bounding box помогают моделям классифицировать изображения и обнаруживать на них объекты.

Используя большой и точный набор данных с размеченными изображениями системы машинного обучения могут автоматически определять закономерности.

Сервис обучения алгоритмов машинного обучения для обнаружения объектов

Сервис 2Captcha предлагает API для разметки изображений.

Разметка изображений выполняется в соответствии с требованиями закзачика и чаще всего заключается в рисовании рамки как можно ближе к краям искомых объектов.

Сервис помогает обнаруживать объекты, аннотируя bounding box рамки вокруг интересующих объектов с высокой точностью и скоростью.

Используя наше решение, вы можете строить современные модели компьютерного зрения на основе machine learning.

API

Метод bounding box можно использовать для решения задач, в которых вам нужно выбрать определенный объект или нарисовать рамку вокруг объекта, показанного на изображении, а также для разметки данных.

Поддерживаемые форматы изображений: JPEG, PNG, GIF
Максимальный размер файла: 600 kB
Максимальный размер изображения: 1000px с любой стороны

Спецификация для типа задачи BoundingBoxTask

Свойство	Тип	Обязателен	Описание
type	Строка	Да	Тип задачи: BoundingBoxTask
body	Строка	Да	Изображение закодировано в формат Base64. Также поддерживается формат Data-URI (содержащий префикс `data:content/type`)
comment	Строка	Да*	Работникам будет показан комментарий, который поможет им правильно разгадать капчу. Свойство `comment` обязателено, при отсутствии свойства `imgInstructions`.
imgInstructions	Строка	Да*	Необязательное изображение с инструкцией, которое будет показано работникам. Изображение должно быть закодировано в формат Base64. Максимальный размер файла: 100 кБ. Свойство `imgInstructions` обязателено, при отсутствии свойства `comment`.

Пример запроса

Метод: createTask
Конечная точка API: https://api.2captcha.com/createTask

{
    "clientKey":"YOUR_API_KEY",
    "task": {
        "type":"BoundingBoxTask",
        "body":"/9j/4AAQSkZJRgABAQAAAQ..HIAAAAAAQwAABtbnRyUkdCIFhZ.wc5GOGSRF//Z",
        "comment":"draw a tight box around the green apple"
    }
}

Пример ответа

{
    "errorId": 0,
    "status": "ready",
    "solution": {
        "bounding_boxes": [
            {
                "xMin": 310,
                "xMax": 385,
                "yMin": 231,
                "yMax": 308
            }
        ]
    },
    "cost": "0.0012",
    "ip": "1.2.3.4",
    "createTime": 1692863536,
    "endTime": 1692863556,
    "solveCount": 1
}

Ссылки

Дополнительная информация:

FAQ
Цены

Подробная информация о методе bounding box опубликована на странице API.