Уведомление об использовании файлов cookie

Этот сайт использует cookie. Файлы cookie запоминают вас, поэтому мы можем предоставить вам персонализированные услуги. Подробнее.

Обновление по reCAPTCHA на google.com

Обновление информации по поводу reCAPTCHA на google.com

Данная статья является продолжением вчерашней статьи.

Две проблемы

Сегодня мы заметили не самые лучше результаты по качеству решений reCAPTCHA на google.com, есть две беды

  1. Большой процент нераспознанных капч. К сожалению, если работник отказался от решения капчи или у из-за плохой прокси капча у него не прогрузилась полностью, то решена она уже не будет - мы не передадим её другому работнику, т.к. при повторной загрузке она даст 100% невалидный токен.
  2. Низкий процент валидныйх токенов (40-60%)

Решение

С первой проблемой мы пока ничего не можем поделать, но мы полностью возвращаем средства за неразгаданные капчи.
А вот со второй проблемой мы сегодня много воевали и пришли к некоторым выводам:

  1. Прокси можно не слать, но с ними процент корректных токенов выше
  2. Куки нужно использовать, но не брать куки нашего работника, а присылать нам куки Вашего парсера, что бы работник решал капчу с ними

Если слать прокси и куки, то процент валидных токенов поднимается до 100%!
Итак, что нужно дополнительно слать к тому, что было вчера:

  1. cookies
    Присылайте капчу с параметром
    "cookies" Cтрока. Двоеточие отделяет название куки от содержимого, точка с запятой - разделяет куки.
    Пример:
    cookies=ANID:AHWqTUkiE1lX;NID:204=SbYHJRGMb4wtUG2

  2. Proxy
    "proxy" Строка. Формат: логин:пароль@123.123.123.123:3128
    "proxytype" Строка. Тип вашего прокси-сервера: HTTP, HTTPS, SOCKS4, SOCKS5.
    Пример:
    proxy=login:pass@123.123.123.123:3128
    proxytype=HTTP

Важно отметить

  1. Как получить куки от google.com, если я взаимодействую с иным сайтом и парсер не заходил на google.com до момента получения капчи?
    Допустим, вы парсите выдачу по домену www.google.sm и у вас нет кук от google.com. Просто перед тем как начать парсить, зайдите на https://google.com и сохраните полученные куки. В момент, когда получите капчу - пришлите нам эти куки.
  2. Если у Вас не сработал токен или мы не решили капчу, то нельзя пытаться решить капчу на этой же странице. Вы должны вернуться в поиск и снова получить капчу из поиска. Попытки пройти капчу на той же странице 100% не закончатся успехом, а IP-адреса будут заблокированы в google

Прямой эфир!

Кстати, вы можете следить за новостями по этой проблеме в "прямом эфире" на форуме:
https://captchaforum.com/threads/google-search-obnovlenie-ot-18-maya-2020.683/#post-1521