Обход голосовой капчи: Распознавание речи из аудио в текст
Сервис 2Captcha внедрил в API поддержку распознавания текста по аудиозаписи. Поддерживается распознавания речи из аудиозаписей длинной до 1 мегабайта. Метод можно использовать для обхода аудио капчи, включая решение reCAPTCHA audio.
Работники в процессе распознавания не участвуют. Распознавание речи происходит с использованием программного обеспечения.
Программное обеспечение — нейронная сеть, которая обучена распознавать речь на определенном языке. Для обучения моделей используются массивы данных. Это позволяет постоянно улучшать качество распознавания.
Программное распознавание аудиофайлов отличается быстрой скоростью ответа и подходит для предзаписанных аудиофайлов большого размера.
Аудио распознавание позволяет преобразовывать в текст аудиофайлы следующих характеристик:
- Максимальный размер файла составляет 1 мегабайт
- Максимальная длительность записи не ограничена
Какие языки в аудио распознаёт 2Captcha? Модель распознавания поддерживает:
- Английский
- Французский
- Немецкий
- Греческий
- Русский
- Португальский
Какие форматы поддерживаются для распознавания аудио? Модель поддерживает:
- mp3
Сервис работает через API. Всё, что нужно для работы, вы можете найти в документации.
Как распознать аудио в текст
Аудиозапись может быть преобразована в текст с помощью API 2Captcha.
Чтобы распознать аудио, необходимо выполнить 2 запроса:
- Отправить файл на распознавание.
- Получить результат.
Отправка запроса
Для отправки запроса нужно отправить всего четыре параметра:
параметр | описание |
---|---|
key | Ключ API. |
method | audio - указывает на метод распознавания аудио. |
body | Строка base64, содержащая закодированный аудио файл в формате mp3 |
lang | Язык аудио. Поддерживаемые языки:'en' : Английский'fr' : Французский'de' : Немецкий'el' : Греческий'pt' : Португальский'ru' : Русский |
Отправить запрос нужно к файлу in.php.
Пример:
{
"key":"xxxxx",
"method":"audio",
"body":"",
"lang":"pt",
"json":1
}
Если аудио файл успешно принят в обработку, должен вернуться ответ, содержащий id
запроса.
Пример:
{
"status":1,
"request":"5"
}
Если отправка файла завершилась ошибкой, должен вернуться ответ с ошибкой. Перечень всех ошибок с описанием собран в списке.
После отправки запроса нужно подождать 15-20 секунд пока файл обработается и затем можно выгрузить распознанный текст отправив HTTP GET запрос к API по URL res.php.
Получение распознанного текста
Чтобы выгрузить результат нужно передать id
отправленного ранее запроса, это значение из параметра request
.
Отправить запрос нужно к файлу res.php
. Для отправки запроса нужно отправить всего три параметра:
параметр | описание |
---|---|
key | ключ API |
action | get - означает запрос на возврат результата |
id | ID запроса, переданное файлом in.php |
Пример запроса:
{
"key":"xxxxx",
"action":"get",
"id":5
}
Если обработка файла завершена, должен вернуться ответ.
Примера ответа:
{
"status": 1,
"request": "hello world"
}
Если распознавание файла не завершено, должен вернуться ответ CAPCHA_NOT_READY
.
Если обработка файла завершилась ошибкой, должен вернуться ответ с ошибкой.
Цена
Цена за 1000 запросов завершившихся успешно составляет 0,5 $.
Полезные ссылки
Распознавание речи (speech-to-text — STT) — это процесс преобразования речи в текст. Сервис распознавания позволяет преобразовать аудиозапись в текст. Перед началом использования API ознакомьтесь с документацией.
Примеры работы с API на языках программирования: