14.05.2013

рекапча

Для защиты от спамерских роботов применяют капчи — сгенерированные изображения слов, которые человек должен распознать. Недавно я обнаружил решение попрагматичнее. Книги, изданные до эпохи компьютеров, переводятся в цифровую форму, но ПО для распознавания текста (OCR) некоторые слова не может распознать. Эти слова предлагаются посетителям сайтов. Теперь посетители сайтов могут гордиться тем, что они выполняют полезную работу: помогают оцифровывать книги. :) Новую технологию назвали рекапчей (Carnegie Mellon University (на англ.), Wikipedia (на англ.), Википедия).

У рекапчи, в отличие от капчи, возникает своя проблема: теперь компьютер не может проверить, что рекапча была распознана правильно. Поэтому пользователю вместе с неизвестным словом предлагается проверочное слово, цифровая форма которого известна, причём пользователь не знает, какое из них какое. Откуда берётся проверочное слово, я не нашёл однозначного ответа. Если оно генерируется как обычная капча, как написано в Википедии, то это создаёт уязвимость. Если капча будет взломана, будет взломана и рекапча. Лучше было бы, если бы проверочным словом было тоже отсканированное слово, нераспознанное компьютером, но распознанное «гарантированным человеком», например, администратором проекта. Это позволяет избежать привязки к обычной капче. Пул проверочных слов может пополняться по мере того, как посетители Интернета распознают новые слова (для надёжности каждое слово предлагается нескольким посетителям).

Также на сайте проекта предлагают защищать e-mail-ы от спамеров. Любой человек может воспользоваться их сервисом Mailhide: вместо того, чтобы показывать e-mail открытым текстом, может спрятать его за рекапчей. Например: узнай мой e-mail.

Комментариев нет :

Отправить комментарий