人間ではなくAIをだますことができるテキストのCAPTCHAチャレンジはありますか?


10

テキストの CAPTCHA を生成する現代的な手法はありますか(人は正しいテキストを入力する必要があります)、いくつかの視覚的な難読化方法でAIを簡単にだますことができますが、人間は苦労せずにそれらを解決できますか?

たとえば、画像に埋め込まれたテキストを(フラッシュやJava、画像分類などの外部プラグインを考慮せずに)認識し、書き込まれたテキストまたは同様のものを再入力する単純な機能について話している。

ノイズを追加したり、グラデーションを付けたり、文字を回転したり、色を変更したりすることは、すぐに壊れてしまう可能性があるため、信頼できる方法ではなくなったと思います。

提案や調査は行われましたか?


4
この種の逆ではないですか?通常、誰かがボットをだますことができると思われるキャプチャを最初に作成すると、他の人がボットを自動的に解決することに取り掛かります。あなたが考えるかもしれない新しいものは、すぐに時代遅れになるでしょう。
潜伏状態のLurker

人間がコンピュータより上手にできることを考えてみてください。私たちは推論することができ、私たち(ネイティブスピーカー)はほぼすべてのイディオムを知っています。詳細については、こちらをご覧ください。テキストに関しては、NLPで分析されたテキストをユーザーに入力して、宣言された感情に一致させるか、何かを表現するのが最善だと思います。コンピュータは、明確で適切に構成された文を作成することはあまり得意ではありません(しかし、ほとんどの人間はそれも得意ではないでしょう)。
JakeD 2016年

通常、テキストのCAPTCHAは、CATPCHAがテキストとして提示されることを意味するために使用され、必要なユーザー入力はテキストである必要はありません。たとえば、TextCaptchaです。
Theraot

回答:


5

それは人間をユニークにするものについての興味深い質問です。Hubert DreyfusによるWhat Computers Cant Doという題名の良い本があります。

コンピューターが(現時点では)処理できないタスクの1つは、重要なものをランク付けすることです。たとえば、CAPTCHAは、重要度に応じて、ランダムなリスト(小さいもの、1つ、5つ、または6つの項目)を注文するように要求します。この特定の演習では、AIが人間の判断に基づいて(常に合理的ではない)決定を行う必要があります。


5

機能する可能性のある方法は、廊下の2本の線が同一であるが、人間の目には長いように見える錯覚を利用することです。私たちの目は長く見えますが、コンピュータにとっては、同じ長さの線です。もちろん、目の障害を持つ人がそれを完了できないという問題は常にありますが、それに対処するためにさまざまな幻想を使用することができます。


2

最新の分類子では解決できないビデオ内の強調表示されたオブジェクトにユーザーにラベルを付ける

最先端のビデオ分類子を作成します。GoogleのYouTube-8Mでトレーニングすることもできますビデオトレーニングデータでトレーニングすることもできます。ただし、継続的にオリジナルの動画もフィードする必要があります。

可能な限り多くのオブジェクトに分類ラベルを付けます。オブジェクトとして認識できるが、ラベルを付けることができないオブジェクトを分離します。

オブジェクトの概要を示すビデオを出力します。できればGIFで、フォームに簡単に埋め込むことができます。

これらの100については、オブジェクトが何であるかを100人のユーザーに尋ねます。ユーザーの90%がオブジェクトの名前に同意する場合は、そのビデオをキャプチャセットに追加します。これを事前トレーニング済みセットと呼びます。

ユーザーが認証を必要とするたびに、事前トレーニング済みのセットではなく、ハイライトされたオブジェクトの1つを動画で見せます。画像の表示が100未満の場合は、ラベルを記録し、事前トレーニング済みのセットから別のラベルをユーザーに提供します。彼らがそれを正しく理解している場合は、それらを通過させます。そうでない場合は、事前訓練されたセットから別のものを提供します。

事前トレーニングを受けていない動画の表示回数が100を超え、キャプチャユーザーの90%以上が同意したら、その動画をトレーニング後のセットに追加します。

時間の経過とともに、事前トレーニング済みのセットをゆっくりと取り外します。トレーニング後のセットの各ビデオに有効期限を設定し、有効期限が切れた後に削除して、何度も使用されないようにします。

理想的には、このプロセスは常にビデオ分類子を改善し、最新の状態に保ち、他の分類子よりもわずかに先に進みます。おそらく、他の分類子に対してこの分類子を特化するために、あまり一般的でない単語やオブジェクト、より難解なものを優先することもできます。

画像ラベリングについても同じことができますが、AIの進歩を考えると、ビデオ分類器の有用性はおそらく長く続きます。

しかし厳密に言えば、いくつかの量子的な手口を除けば、いつの日か外部のAIシステムによって解決されないキャプチャシステムはありません。

(編集:ああ、私はあなたが特に「テキストキャプチャ」と言ったことに気づきました。それがあなたが意味するものであるなら、私はテキスト分類に多くの謎が残っているとは思いません。コンピューターはおそらく人間よりも優れた画像からテキストを収集できるでしょう。しかし、技術的には、上記のキャプチャシステムの入力はテキストです。)

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.