Запустили bounding box сервис по распознаванию и разметке объектов на изображениях
Запустили bounding box сервис по распознаванию и разметке объектов на изображениях.
Метод bounding box может использоваться для аннотирования различных объектов или границ на изображении.
Статья описывает процесс взаимодействия с API.
Bounding box
Что такое bounding box? Bounding box - это прямоугольный контур вокруг объекта или нужной области на изображении. Этот метод часто используется для аннотирования изображения в целях машинного обучения.
Область применения
Bounding box обычно используется для аннотирования изображений в проектах машинного обучения, в частности в области компьютерного зрения, для решения таких задач, как обнаружение объектов и классификация изображений.
Аннотатор или маркировщик формирует прямоугольник вокруг объекта или нужной области на изображении создавая ограничительную рамку. Прямоугольная граница устанавливается с помощью методов маркировки данных. Затем для ее определения обычно используются два набора координат x и y.
Фигуры обозначают местоположение и границы объектов на изображениях. Они могут использоваться для различных типов объектов, таких как люди, животные, автомобили, здания и т.д. Некоторые объекты могут быть лучше представлены, если повернуть ограничительные рамки в соответствии с их формой. Это называется oriented bounding box и является особенностью некоторых инструментов разметки. Bounding box могут иметь и другие типы меток, такие как классы и атрибуты. Классы используются для наименования объекта, а атрибуты - для описания его специфических особенностей.
Bounding box полезны для обучения и тестирования моделей машинного обучения, позволяющих обнаруживать объекты на изображениях. Такие модели, например YOLO, обучаются на базе изображений с bounding box метками. Затем они могут предсказывать границы и метки для других изображений, которые они раньше не обрабатывались.
В области компьютерного зрения bounding box играют важную роль в задачах обнаружения и локализации объектов. Рисуя прямоугольные рамки вокруг интересующих объектов на изображениях, аннотаторы предоставляют явную информацию о местоположении и размерах объектов. Разметка служит обучающим набором для моделей машинного обучения, позволяя точно идентифицировать и классифицировать объекты на изображениях.
Bounding box и обнаружении объектов
Что такое обнаружение объектов? Целью обнаружения объектов является поиск и маркировка конкретных типов объектов (например, людей, зданий или автомобилей) на фотографиях и видео с помощью компьютерного зрения и обработки изображений - компьютерных технологий, позволяющих анализировать и обрабатывать визуальные данные.
Обнаружение объектов - это задача из ниши машинного обучения. Чтобы научиться определять объекты на изображениях, моделям искусственного интеллекта необходимы большие массивы данных изображений, на которых объекты аннотированы с помощью bounding box. Нарисовать рамку вокруг каждого объекта на изображении - это один из способов облегчить обнаружение объектов
Аннотации с bounding box помогают моделям классифицировать изображения и обнаруживать на них объекты.
Используя большой и точный набор данных с размеченными изображениями системы машинного обучения могут автоматически определять закономерности.
Сервис обучения алгоритмов машинного обучения для обнаружения объектов
Сервис 2Captcha предлагает API для разметки изображений.
Разметка изображений выполняется в соответствии с требованиями закзачика и чаще всего заключается в рисовании рамки как можно ближе к краям искомых объектов.
Сервис помогает обнаруживать объекты, аннотируя bounding box рамки вокруг интересующих объектов с высокой точностью и скоростью.
Используя наше решение, вы можете строить современные модели компьютерного зрения на основе machine learning.
API
Метод bounding box можно использовать для решения задач, в которых вам нужно выбрать определенный объект или нарисовать рамку вокруг объекта, показанного на изображении, а также для разметки данных.
Поддерживаемые форматы изображений: JPEG, PNG, GIF
Максимальный размер файла: 600 kB
Максимальный размер изображения: 1000px с любой стороны
Спецификация для типа задачи BoundingBoxTask
Свойство | Тип | Обязателен | Описание |
---|---|---|---|
type | Строка | Да | Тип задачи: BoundingBoxTask |
body | Строка | Да | Изображение закодировано в формат Base64. Также поддерживается формат Data-URI (содержащий префикс data:content/type ) |
comment | Строка | Да* | Работникам будет показан комментарий, который поможет им правильно разгадать капчу. Свойство comment обязателено, при отсутствии свойства imgInstructions . |
imgInstructions | Строка | Да* | Необязательное изображение с инструкцией, которое будет показано работникам. Изображение должно быть закодировано в формат Base64. Максимальный размер файла: 100 кБ. Свойство imgInstructions обязателено, при отсутствии свойства comment . |
Пример запроса
Метод: createTask
Конечная точка API: https://api.2captcha.com/createTask
{
"clientKey":"YOUR_API_KEY",
"task": {
"type":"BoundingBoxTask",
"body":"/9j/4AAQSkZJRgABAQAAAQ..HIAAAAAAQwAABtbnRyUkdCIFhZ.wc5GOGSRF//Z",
"comment":"draw a tight box around the green apple"
}
}
Пример ответа
{
"errorId": 0,
"status": "ready",
"solution": {
"bounding_boxes": [
{
"xMin": 310,
"xMax": 385,
"yMin": 231,
"yMax": 308
}
]
},
"cost": "0.0012",
"ip": "1.2.3.4",
"createTime": 1692863536,
"endTime": 1692863556,
"solveCount": 1
}
Ссылки
Дополнительная информация:
Подробная информация о методе bounding box опубликована на странице API.