スパムボットはどのように機能しますか?


43

私はフォーラムスパムボットによって大ヒットしているフォーラムを持っています。そしてもちろん、何かを打ち負かす最良の方法は敵を知ることです。後でそれらのスパムボットを倒すことを心配しますが、今はそれらについてもっと知りたいです。読み返してみると、主題に関する詳細な情報が不足していることに驚きました(または、Google検索結果を改善するために正しい検索用語を入力することができなかったのかもしれません)。

私は、スパムボットに関するすべてを学ぶことに興味があります。私は他のフォーラムで質問し、「Spambotsは常にあなたのサイトに登録しているユーザーです」のようなブラシオフの回答を得ました。

  • フォーラムスパムボットはどのように機能しますか?
  • 「新規ユーザー登録」ページをどのように見つけますか?(特にwww.forum.com/register.htmlのように、専用のURLを持たないフォーラムもありますが、代わりにクエリ文字列やURLバーに表示されない他のメソッドを使用しているフォーラムがあります)
  • 彼らは、各「新規ユーザー登録」フィールドに入力する内容をどのように知っていますか?
  • スパム/データ入力可能なページとそうでないページをどのように判断しますか?
  • 彼らもこのページを「表示」しているのでしょうか?
  • ..そうでない場合、彼らはサーバーと直接通信していると仮定します-どのように-これは可能ですか?どうやってやっているの?
  • フォーラムスパムボットはCAPTCHAを破ることができますか?彼らは論理的な質問を解決できますか(どのように?)?数学の質問?
  • クライアント側のアンチボット検証スクリプトをリバースエンジニアリングしますか?サーバー側のスクリプト?
  • それらを防ぐためにまだ有効なテクニックは何ですか?
  • スパムボットはどこから来たのですか?ボットがサイトを次々と破壊するのを見ると、コンピューターの後ろに座っている人はだらしないですか?それとも、どういうわけかそれを単にインターネット上に「リリース」するので、彼らはickerしているのでしょうか?スパムボットは感染したコンピューターによってどこかで「実行」されていますか?彼らは自分自身を複製しますか?

回答:


48

「新規ユーザー登録」ページをどのように見つけますか?(特にwww.forum.com/register.htmlのように、専用のURLを持たないフォーラムもありますが、代わりにクエリ文字列やURLバーに表示されない他のメソッドを使用しているフォーラムがあります)

彼らは次の方法で新しいサイトを見つけます。

  • クロールし、既知のソフトウェアの署名を探します。通常、これは著作権やメタタグのようなテキストのスニペットですが、一貫した識別子である可能性があります。これは通常、ブログおよびフォーラムソフトウェアに適用されます。
  • 手動で含める。世界の多くの地域で人件費が安い人間は、簡単に悪用可能な既知のソフトウェアまたはフォームを探してデータベースに追加します。これは通常、カスタム登録および連絡フォームに適用されます。
  • 彼らはリストを買う。電子メールアドレスがスパマーによって販売されているように、既知の脆弱または優先ターゲットサイトリストも販売されています。

彼らは、各「新規ユーザー登録」フィールドに入力する内容をどのように知っていますか?

彼らは、フィールド名をガイドとして使用して、各フィールドに入力する内容を知っています。99.99%の確率で、メールアドレスフィールドの名前が「email」または「email」という単語を含むものになります。あなたがロケット科学者である必要はなく、その分野がおそらく電子メールアドレス用であることを知っている必要はありません。名前、ログインID、アドレスなどのようなものについては、同じ原理で機能します。

スパム/データ入力可能なページとそうでないページをどのように判断しますか?

彼らは気にしません。自動化ツールは、非常に多くのフォームを短時間で実質的に無料で試すことができるため、可能なすべてのフォームを試すのは簡単です。人間の労力が関与する場合、彼らは「スクリプトキディ」になり、明白なものを試して、フォームが潜在的に脆弱であることを示す何らかの応答を得るかどうかを確認します。基本的に、フォームはユーザー入力を受け入れるページと同様に、フォームに対する潜在的なターゲットです。

フォーラムスパムボットはどのように機能しますか?

彼らもこのページを「表示」しているのでしょうか?..そうでない場合、彼らはサーバーと直接通信していると仮定します-どのように-これは可能ですか?どうやってやっているの?

スパムボットはどこから来たのですか?ボットがサイトを次々と破壊するのを見ると、コンピューターの後ろに座っている人はだらしないですか?それとも、どういうわけかそれを単にインターネット上に「リリース」するので、彼らはickerしているのでしょうか?スパムボットは感染したコンピューターによってどこかで「実行」されていますか?彼らは自分自身を複製しますか?

すべて自動化されています。xrumerのようなツールが構築、販売されており、既知の脆弱性を持つソフトウェアを悪用する機能が含まれています。誰でもそれを購入でき、セットアップ後は多かれ少なかれ火と忘れがちです。リスト内のすべてのフォーラムにアクセスし、可能な限りスパムを送信しようとします。ブルートフォースが原因で成功し、スパマーにとって価値があります。それが彼らが決して止まらない理由です。動作させるために指を持ち上げる必要はほとんどありません。

フォーラムスパムボットはCAPTCHAを破ることができますか?彼らは論理的な質問を解決できますか(どのように?)?数学の質問?

はい、ただし常にではありません。実装の程度に依存します。しかし、大企業が提供するものを含む多くのキャプチャーはbeatられており、事実上役に立たない。そのため、それらを停止するには複数の形式の保護が必要です。その場合でも、人間は通常どんなシステムにも勝てる。

それらを防ぐためにまだ有効なテクニックは何ですか?

前の回答から:次のようないくつかのことを行うことができます(そして、2つ以上を行う必要があります)。

1)ボットのみに見える偽のフィールドを配置します。次に、そのフィールドがフォームの残りの部分とともに送信された場合、それを無視できます(必要に応じて禁止します)。また、隠しリンクをたどる悪いボットをトラップすることもできます。

2)reCAPTCHAのようなCAPATCHAを使用する

3)ユーザーが5 + 3のような質問に答える必要があるフィールドを使用します。人間は誰でも答えられますが、ボットはフィールド名に基づいてフィールドに自動入力するため、何をすべきかわかりません。そのため、そのフィールドは正しくないか欠落しているため、送信は拒否されます。

4)トークンを使用してセッションに入れ、フォームに追加します。トークンがフォームと一緒に送信されない場合、または一致しない場合、トークンは自動化され、無視できます。

5)同じIPアドレスからの繰り返し送信を探します。フォームがあまり多くのリクエストを受け取るべきではないが、突然ボットにヒットしている可能性がある場合、一時的にIPアドレスをブロックすることを検討する必要があります。

6)Akismetを使用します。スパムの識別に優れています。


5
+1を徹底的に答えてください。スパムの問題があり、非表示のフォーム要素を実装し、それを「email」/「mail」および「address」と名付けた実際のメールアドレス入力と呼びました。これ以上のスパムはありません!
mar10

1
荒らしに対処する方法について良いポスト(アイデアは、スパムロボットも同じです):codinghorror.com/blog/2011/06/suspension-ban-or-hellban.html
ercpe

キャプチャについては、それらを無効にするために使用しているツールに依存します。時には(常にではないが)キャプチャに合格するソフトウェアプログラムがあり、その後、安価な労働力を使用してキャプチャを解決するサービスがあり、これらの成功率は高くなります。
ub3rst4r

11

フォーラムスパムボットはどのように機能しますか?

才能のある(悪の場合)プログラマーがそれらを書く-おそらくそれらを書く人と同じくらい多くの異なるタイプのスパムボットがありますが、残念なことに、それは少数のスパムボットの著者が管理者のために人生を台無しにするために彼らの仕事を共有し、売るだけです...

人気のあるフォーラムスパムアプリケーションの1つは「xrumer」です。

私はこれがあなたの質問のすべてに答えているわけではないことを理解していますが、ボットがうまくできないこと(複雑で非静的なロジックの質問を解決するなど)は、低賃金の労働者が海外で行うことができることに言及する必要があると思います。スパムは他のビジネスとよく似ており、スパムメッセージを発信するために安価な労働力が不足することはありません。


4
私はちょうど肉工場で牛が加工されているのを見たように感じます。しかし、非常に有益です。
rlb.usa

興味深いビデオ、クリスマスイブになったことは面白い。日付は12-25-2006 12:15 am ... :-)
失策

了解!どうやらその才能ではないようです...そのプログラムはFriendBlasterを思い出させます(以前は仕事で使用していました。反対しましたが、上司は聞きませんでした)。著者がプログラムに費やした時間と労力を疑うことはありません。しかし、正直なところ、実行されているものは何も実装するのが難しいことではありません(そして、FriendBlasterの場合は実装が不十分です)。より印象的なのは、リリースから数週間以内にエクスプロイトを開発し、DRMスキームを破るハッカーとセキュリティ研究者です。
レーゼマジェス

2

私はWordPress用のAnti-spamプラグインを作成しました。これはCaptchaなどを使わずにスパムをブロックします。

仕組み:コメントフォームに2つの追加フィールドが追加されます。最初は、現在の年についての質問です。2番目は空でなければなりません。ユーザーがサイトにアクセスすると、最初のフィールドはjavascriptで自動的に回答され、2番目のフィールドは空白のままになり、両方のフィールドはユーザーに対して非表示および非表示になります。スパマーがコメントフォームを送信しようとすると、最初のフィールドで回答を間違えたり、空のフィールドを送信しようとしてスパムコメントが拒否されます。ユーザーはCaptchaや他の何かを入力してボットではないことを証明する必要はありません。すべてはJavaScriptによって行われます。

プラグインをダウンロードし、コードを使用してサイトのスパムの問題を解決できます。


1
あなたのユーザーは登録するためにJavaScriptが必要ですか?アクセシビリティの損失ですよね?
オーガスティンリーディンガー14

@AugustinRiedinger JavaScriptを無効にしたアンチスパムプラグインは、単純なcapthaアプローチのように機能します。JavaScriptが無効になっているユーザーは約2%未満です。
webvitaly 14

その場合、キャプチャを表示するということですね。そこにいるユーザーはごくわずかですが、ベストプラクティスの観点から考えていました。それについて興味深いことを読んでください
オーガスティンリーディンガー14

@AugustinRiedingerはい、ユーザーがjavascriptを無効にしている場合、現在の年についてcaptchaのような質問を表示します。
webvitaly 14

0

それらを打ち負かそうとするとき、私が心に留めておくべきことの一つは、彼らの目的は通常、ブラックハットSEOの利益のためにできるだけ多くのウェブサイトへのリンクを投稿することです。

彼らはあなたのサイトではなく、アクセスするサイトの量を気にします。あなたのサイトだけをスパムしたい人は、ロボットを使わずに簡単にサインアップできます。

そのため、よく書かれた特注テスト(フォーラムのメンバーが答えを知る質問など)は、ロボットが賢明である可能性のある事前に作成されたものよりも、ロボットに対してほとんど常に効果的であると確信しています。に。

たとえば、ロボットがRecaptchaをクラックした場合、何百万ものフォームにアクセスしてスパムを送信できます。特注のテストに割り込んだ場合、1つのWebサイトにしかアクセスできないため、自動化されたスパムボットはそれを実行しません。

https://www.projecthoneypot.orgは、使用する適切なデータを提供する場合があります(ブロックするキーワードやIPなど)

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.