Vulpo One

reCAPTCHA: капча, в которую можно втыкать

CAPTCHA («Completely Automated Public Turing test to tell Computers and Humans Apart» — полностью автоматизированный публичный тест Тьюринга для различения компьютеров и людей) — это система, защищающая публичные и не только службы сообщений от массовой отправки нежелательных сообщений (т.е. спама). Ну то есть та весёлая картинка, которую вам показывают при регистрации на форуме или там отправке комментария, чтобы вы доказали, что вы не робот. (Если вы читаете это в основном дневе и вы там незарегистрированный пользовтель [а там вы явно незарегистрированный пользователь, потому что единственный зарегистрированный кроме меня пользователь там и не появляется {Hey Jimmy, если ты это всё же читаешь… гм… эхм… ладно, без комментариев}], то вам придется ее разгадать, чтобы оставить тут коммент)

Как и принято в народе не доведённое до абсурда рабочим не считается, что и описано метко в дневнике Леонида Каганова в заметке от 25 апреля 2008. Но чтобы не мучить пользователей подобным образом, существует несколько иной подход: сервис reCAPTCHA.

UPD: здесь была рекапча версии 1, но она давно отключена

Пример reCAPTCHA можно видеть между этим и предыдущим абзацами. (опять-таки, если вы читаете оригинал или удачный кросспост)

Особенности системы:

  • Использование вполне человеческих слов во вполне человеческом написании
  • Над этими словами уже потрудилась современная система OCR и признала их нечитабельными для роботов

Откуда же берутся нечитабельные слова? Очень просто: эти слова попадают в базу reCAPTCHA из ВЦ, занимающихся оцифровкой книг в массовом порядке. Поскольку даже лучшие OCR несовершенны и нередко ошибаются, а садить человеков, чтобы они следили за машинами накладно, невыгодно, а в нужных для такого дела объёмах и невозможно, эти слова отсылаются системе reCAPTCHA, которая подсовывает их пользователям, страстно желающим получить доступ к нужной информации или оставить своё ценное мнение “КГ/АМ” о прочитанном материале. Таким образом получается своеобразный Grid с человеками в качестве конечных узлов. (Вачовски, привет!)

Но если расшифровка заранее неизвестна как же работает капча? Ещё проще: вам выдаются сколько слов? Два! Одно известное системе, другое — нет. Если контрольное введено верно, то считается, что распознаваемое тоже, а если несколько пользователей расшифровали слово одинаково, то значит вообще правильно и можно передавать дальше.

Из недостатков следует отметить факт, что для реализации на своём сайте необходим доступ к сокетам, что редко встречается на бесплатных хостингах.

Официальный сайт проекта — http://recaptcha.net/

P.S. О заголовке. Пока я втыкал на их сайте в описание, чёваще за система, параллельно использовал их демку (вставлена тут между вторым и третьим абзацами и стопудов отображается в оригинальном дневе) как игру-времяубивалку. А еще весело осмысленные сочитания истолковывать. Тоже втыкабельно.