recaptchaは、写真の偽の翻訳を入力していないことをどのように認識しますか[クローズ]


22

私が理解していることから、キャプチャは、フィルター、ノイズ、その他の雑多なアルゴリズムの適用によって歪められたテキストです。したがって、その人の読解能力がその人の能力であるかどうかを調べるには、彼らが答えたものと既知の答えが何であるかを比較します。

現在、ReCaptchaを読んで、表示される単語はOCRで翻訳できない単語であると書かれています。さらに、recaptchaはこれらの画像の翻訳に使用されています。本当にあなたの読書が正しいのか、それとも単に物を作り上げているのかをどのように知ることができますか?

それが言っていることを知っていれば、recaptchaで翻訳資料としては使用されません。テキストの内容がわからない場合、どのように回答を検証しますか?

これはおそらく、翻訳済みとしてフラグを立てる前に、膨大なサンプルサイズを使用した確率ベースの分析であると推測しています。

誰もこれに対する答えがどこにあるか知っていますか?


3
興味深いのは、タイムポーリングでの4chan /匿名の悪ふざけです。「マーブルケーキ、ゲーム」、2番目の単語のクラウドソーシング検証の欠陥を悪用しました。
ダンビール

回答:


33

本のページは基本的に写真スキャンされ、「光学文字認識」(OCR)を使用してテキストに変換され、reCAPTCHAの背後にあるコンピュータープログラムで認識されている1つの単語とそうでない単語で画像の形でWebに送られますまだ知られています。

次に、ユーザーは両方の単語を入力し、答えがわかっている単語を解くと、システムはその答えが新しい単語に対して正しいと仮定します。次に、システムは新しいイメージを他の多くの人々に提供し、元の答えが正しかったかどうかをより高い信頼性で判断します。したがって、システムは自己改善サービスであり、時間とともに改善されます。

http://www.google.com/recaptcha/learnmore


22

これが、reCaptchaで2つの単語を入力する理由です。単語の1つは既に知られており、単語の1つは知られていない。キャプチャに合格するか失敗するかは、既知の単語にどのように答えるかによって決まります。他の(不明な)単語に対する回答は、同じ単語に対する他の応答とともに使用され、既知の単語に変換されます。


4
...これはまた、時間が経つにつれてますますイライラし、5回連続で失敗したときにあなたがバカ/ロボットであると確信させる理由でもあります。:-(
Sirex

奇妙な...私は私が覚えているものを失敗したことはありません。
ポール

@Sirex私はかつてそれを考えていましたが、コーパステキストのサイズが一定であるか、キャプチャエントリの数に対して縮小している場合にのみこれが当てはまることに気付きました。真実は、コーパスのテキストが成長しているということです...問題は、その成長が全体的なキャプチャの使用の成長に対応しているかどうかです。
ジョエルCoehoorn

そうかもね。私はめちゃくちゃ難しいreCaptchaをたくさん見ました。既知の単語でさえあいまいな場合。
Sirex
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.