人間の行動とボットの行動をどのように区別できますか?


7

コメントに基づいて更新:

オンラインで特定のアクティビティを実行している人間と、同様のアクティビティを実行するようにプログラムされたボットをどのように区別できますか?たとえば、メールのチェック、音楽ファイルのダウンロード、ebayでのショッピング、Googleでの検索など、またはWebサイトの改ざん/ハッキング、ブルートフォースログインパスワードなど。

質問の範囲を制限し、より明確にするために、観察をネットワーク指向の動作のみに制限します。いくつかの例は、XYZをオンラインで実行するのに費やした時間、ダウンロードされた(たとえば)データの量/タイプです。ファイル共有Webサイト、ソーシャルメディアWebサイトの友達/フォロワーの数など。

人間の行動とプログラムされた行動を区別するいくつかの「パターン」を取得することは可能だと思います。

チューリングテストは私が探しているものではありません。

ここではどのようなテクニックが役に立ちますか?機械学習?ゲーム理論?

関連する学術/研究記事への参照も良いでしょう。


1
チューリングテストを参照してください。チェスでの不正行為の検出に関するKen Reganのプロジェクトも参照してください。
Jonas G. Drange 2013

あなたのような参照リクエストはStack Exchangeには広すぎます-研究領域全体の調査を依頼します!適切な範囲の質問が表示される前に、焦点をかなり絞る必要があります。アドバイザーに相談してGoogle Scholarで検索し、このガイドをチェックして、Academiaのより良い(再)検索を行ってください。
ラファエル

回答:


9

最も一般的で明白な方法は、人間にとっては簡単ですが、コンピュータにとっては難しい(もちろん、CAPTCHAだけではありません)チャレンジ/レスポンステストです。

この種のテストは非常に効果的ですが{1}、HIP(Human Interactive Proofs)領域に該当します。透過的ではありません。

人間のウェブサイトのトラフィックとボットを区別するための一般的な「シンプルな」アプローチは次のとおりです。

  • すべてのフィールドに入力して、入力フォームの送信ボタンをクリックするのにかかる時間(頻繁に使用されますが、簡単にバイパスできます)。

    コミュニケーションのケイデンス/ペースを監視することは、より安全な方法です(これは、GoogleのCAPTCHAなしのreCAPTCHAの機能の1つです)。

  • ハニーポット(つまり、ページ上に存在するリンクまたはフィールドで構成され、人間の目には見えないボットのトラップ)
  • 最大連続セッション時間の分析(人間は休息する必要があります)および時刻との相関Web検索ログで人間とロボット区別するを参照)

ボットの特性は、異なるクローラー/サイトごとに幅広い変動を示すことを考慮する必要があります。したがって、シンプルで確定的なヒューリスティックを導き出すことは困難です。ルールベースのシステムは、定義および維持が難しい(専門家でも)静的なルールの長いリストを意味します。 。

機械学習手法がよく使用されます。

利用可能なほとんどすべてのAI / ML「ツール」が実験されています。これらの教師あり機械学習ツールを使用する主な問題は、トレーニングデータセットのラベル付けです。

分析をネットワーク指向の動作に限定しても、これは途方もない範囲の問題です。このため、さらに検索するためにいくつかのキーワードを与えています。


ノート

  1. 機械学習ベースの攻撃は改善されており、CAPTCHAは人工知能技術のベンチマークタスクとしても機能します(例:終わりは近づいている:テキストベースのCAPTCHAの一般的な解決

キーワード

HIP(Human Interactive Proofs)、CAPTCHA、キーストロークダイナミクス、キーストロークケイデンス、タイピングダイナミクス、IDS(侵入検知システム)、ハニーポット、クリック詐欺、スパムボット


参考文献

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.