Recaptchaのハッキング(別名「陰茎の洪水」)
次に使用した方法は、reCAPTCHAの実装に欠陥があるかどうかを確認することでした。彼らがreCAPTCHAについて発見したことの1つは、デコードするために常に2つの単語をユーザーに提示することでした-1つの単語はreCAPTCHAシステムによって認識されているコントロールワードであり、もう1つは未知の単語です(reCAPTCHAは人間を使用してOCRエラーを修正します)。ウィキペディアはこのプロセスについて説明しています。「スキャンされたテキストは、2つの異なる光学式文字認識プログラムによる分析を受けます。プログラムが同意しない場合は、疑わしい単語がキャプチャに変換されます。単語は、既知のコントロールワードとともに表示され、人間によってラベルが付けられます。人間の裁判官によって一貫して単一のラベルが付けられた単語は、コントロールワードとしてリサイクルされます。」2iasdo4匿名が認識したことは、未知のスキャンされたテキストに常に同じ単語でラベルを付けた場合、そして何千回もこれを行うと、結局、未知の単語の大部分がその単語で誤ってラベル付けされることになります。彼らがしなければならなかったのは、キャプチャの2つの単語を見て、「簡単」なものの適切なラベルを入力し(おそらく2つの光学式スキャナが同意するものと思われます)、「陰茎」という単語を入力するだけでした。難しいもの。彼らがこれを頻繁に行うと、すぐに画像のかなりの割合が「陰茎」としてラベル付けされ、自動投票機能が復元されます(匿名では失われなかった副作用の1つが、今後数年間の概念でした) 「ペニス」という単語がテキスト全体にランダムに挿入された多くのデジタルブックがあります。更新:私はベンモーラーに尋ねました、
reCAPTCHAの最適化
「ペニス」という単語をテキストにまき散らすという概念と同じくらい魅力的で、匿名チームは時計がカチカチと音を立てていることを知っていました。彼らは手動で何度も何度も投票する必要がありました。そして、彼らはできるだけ早くキャプチャに入ることができる必要がありました。彼らは、スキップできるreCAPTCHA単語をすばやく決定できる一連のガイドラインを作成しました。例えば:
あなたは2つの単語を与えられます:1つの本物、1つの偽物。
以下のため[REAL FAKE]
か[FAKE REAL]
、あなただけで入力することができREAL
、それが受け入れられるべきです。
[LOOKSREAL LOOKSREAL]
またはの場合[LOOKSFAKE LOOKSFAKE]
、通常は両方の単語を入力する方が簡単です。どれが本物かを決めるのに貴重な時間を無駄にしないでください。
偽の単語を識別するには、外観と単語の種類の両方を使用します。それらの1つだけに依存しないでください。
ルールセット全体がここにあります:偽のキャプチャー。