人間の行動とボットの行動をどのように区別できますか？

コメントに基づいて更新：

オンラインで特定のアクティビティを実行している人間と、同様のアクティビティを実行するようにプログラムされたボットをどのように区別できますか？たとえば、メールのチェック、音楽ファイルのダウンロード、ebayでのショッピング、Googleでの検索など、またはWebサイトの改ざん/ハッキング、ブルートフォースログインパスワードなど。

質問の範囲を制限し、より明確にするために、観察をネットワーク指向の動作のみに制限します。いくつかの例は、XYZをオンラインで実行するのに費やした時間、ダウンロードされた（たとえば）データの量/タイプです。ファイル共有Webサイト、ソーシャルメディアWebサイトの友達/フォロワーの数など。

人間の行動とプログラムされた行動を区別するいくつかの「パターン」を取得することは可能だと思います。

チューリングテストは私が探しているものではありません。

ここではどのようなテクニックが役に立ちますか？機械学習？ゲーム理論？

関連する学術/研究記事への参照も良いでしょう。

— PNP
ソース

チューリングテストを参照してください。チェスでの不正行為の検出に関するKen Reganのプロジェクトも参照してください。

— Jonas G. Drange 2013

あなたのような参照リクエストはStack Exchangeには広すぎます-研究領域全体の調査を依頼します！適切な範囲の質問が表示される前に、焦点をかなり絞る必要があります。アドバイザーに相談して、Google Scholarで検索し、このガイドをチェックして、Academiaのより良い（再）検索を行ってください。

— ラファエル

最も一般的で明白な方法は、人間にとっては簡単ですが、コンピュータにとっては難しい（もちろん、CAPTCHAだけではありません）チャレンジ/レスポンステストです。

この種のテストは非常に効果的ですが{1}、HIP（Human Interactive Proofs）領域に該当します。透過的ではありません。

人間のウェブサイトのトラフィックとボットを区別するための一般的な「シンプルな」アプローチは次のとおりです。

すべてのフィールドに入力して、入力フォームの送信ボタンをクリックするのにかかる時間（頻繁に使用されますが、簡単にバイパスできます）。

コミュニケーションのケイデンス/ペースを監視することは、より安全な方法です（これは、GoogleのCAPTCHAなしのreCAPTCHAの機能の1つです）。
ハニーポット（つまり、ページ上に存在するリンクまたはフィールドで構成され、人間の目には見えないボットのトラップ）
最大連続セッション時間の分析（人間は休息する必要があります）および時刻との相関（Web検索ログで人間とロボットを区別するを参照）

ボットの特性は、異なるクローラー/サイトごとに幅広い変動を示すことを考慮する必要があります。したがって、シンプルで確定的なヒューリスティックを導き出すことは困難です。ルールベースのシステムは、定義および維持が難しい（専門家でも）静的なルールの長いリストを意味します。。

機械学習手法がよく使用されます。

Webロボット検出：確率論的推論アプローチにより、自動的にログセッションをクローラーまたは人間によるものとして分類するベイジアンネットワークを構築します
ナビゲーションパターンに基づくWebロボットセッションの検出は、C4.5デシジョンツリーアルゴリズムを 使用します（セッション機能の導出後）。
オンライン広告ネットワークのペイパークリックストリームでクリック詐欺を検出することにより、ブルームフィルターから派生した手法が開発されます。
オンラインコンピュータゲームの不正行為検出を高速化するために適用されるニューラルネットワークは、MMORPGのボット検出に人工ニューラルネットワークを採用しています
Twitterで感情を使用してボットを検出する：人間はボットよりも意見が高いですか？ガウシアンナイーブベイズ、サポートベクターマシン、 ランダムフォレストを試す

利用可能なほとんどすべてのAI / ML「ツール」が実験されています。これらの教師あり機械学習ツールを使用する主な問題は、トレーニングデータセットのラベル付けです。

分析をネットワーク指向の動作に限定しても、これは途方もない範囲の問題です。このため、さらに検索するためにいくつかのキーワードを与えています。

ノート

機械学習ベースの攻撃は改善されており、CAPTCHAは人工知能技術のベンチマークタスクとしても機能します（例：終わりは近づいている：テキストベースのCAPTCHAの一般的な解決）

キーワード

HIP（Human Interactive Proofs）、CAPTCHA、キーストロークダイナミクス、キーストロークケイデンス、タイピングダイナミクス、IDS（侵入検知システム）、ハニーポット、クリック詐欺、スパムボット

参考文献

人間に優しいヒューマンインタラクションプルーフ（HIP）の設計 -Kumar Chellapilla、Kevin Larson、Patrice Simard、Mary Czerwinski（Microsoft Research）
The End is Nigh：Generic Solving of Text-based CAPTCHAs by Elie Bursztein、Jonathan Aigrain、Angelika Moscicki、John C.Mitchell（2014）
混合ガウスモデルと深い信念ネットに基づくキーストロークダイナミクスユーザー認証、Yunbin Deng、Yu Zhong（2013）
LíviaCFAraújo、Luiz HR Sucupira Jr.、Miguel G.Lizárraga、Lee L. Ling、JoãoBT Yabu-Utiによる生体認証機能の入力によるユーザー認証（2005）
Omer M. Duskin Dror、G。FeitelsonによるWeb検索ログでの人間とボットの区別
Webロボット検出： Athena Stassopouloua、Marios D. Dikaiakos（2008）による確率論的推論アプローチ
WWWクローラーの動作の調査： MD Dikaiakos、A。Stassopoulou、L。Papageorgiou（Computer Communications、2005）による特性評価とメトリック
Pang-Ning Tan、Vipin Kumar（2002）によるナビゲーションパターンに基づくWebロボットセッションの発見
Luis von Ahn、Manuel Blum、John Langford（Comm。ACM、2004）によって人間とコンピューターを自動的に区別する
Linfeng Zhang、Young Guanによるオンライン広告ネットワークのペイパークリックストリームでのクリック詐欺の検出（IEEE、2008）
Dewanshu Jain、Alok Guptaによるオンラインゲームのボット問題
Gaspareto、Barone、Schneider（2008）によるオンラインコンピューターゲームでの不正行為検出の高速化に適用されたニューラルネットワーク
オンライン広告詐欺の定量化：Ad-Click Bot vs Humans by Adrian Neal、Sander Kouwenhoven（2015）
ボットと人間を区別するための分類アルゴリズムの比較 by Christian Hadiwijaya Saputra、Erwin Adi、Shintia Revina、Bina Nusantara（2014）
Twitterで感情を使用してボットを検出する：人間はボットよりも意見が高いですか？John P. Dickerson、Vadim Kagan、VS Subrahmanian（2014）

— Manlio
ソース