別のWebサイトがミラーリングされており、検索結果で自分のサイトより上位にランクされています


55

私のサイトを完全にミラーリングし、現在、私のコンテンツを使用して、Googleの1位にリンクが表示されているthedirtyという悪評のサイトがあります。ログファイルを確認すると、このサイトがしばらくの間私のサイトをクロールしており、サイトから私のサイトへのリンクが10,000個あることに気付きました。

このサイトから参照されているユーザーアクセスをブロックし、既にウェブスパムとしてGoogleに報告しています。また、ドメインを否認しました。

このような極悪な戦術のために、彼らはどのようにしてGoogleでトップリンクを取得しますか(私のものを追い越しますか)?このような問題を完全に排除する手順は何ですか?

更新日2014年8月28日:

詳細がわかりましたので、これについての最新情報を提供すると思いました。そのため、thedirtyはサブドメインを私のIPに向け、サブドメインを私のWebサイトのように見せることができました。

htaccessを使用して、私のドメインではないすべてのホストをリダイレクトして、基本的にGoogleでサブドメイントラフィックリンクを取得することを意味したため、2、3日これはそれほど重要ではありませんでした。数日後、thedirtyはサブドメインを変更してWebサイトを指すようにしたので、この恩恵を受けられなくなりました。

だから、彼らが私のコンテンツを使ってGoogleでトップランクを獲得しているという全体のポイントは、彼らのウェブサイトへのリンクを指し示し、彼らのウェブサイトへのトラフィックを増やしています。

それは汚いウェブサイトによる汚い戦術です。私の希望は、Googleがそのような行動を罰することです。


3
あなたが彼らの動機に疑問を抱いている部分を編集しました。しかし、そうでなければ良い質問です。
ジョンコンデ

1
ウェブサイトのクローン作成は新しいトリックのようです。現在、多くのウェブサイトが悪用されています。このトピックに関するニュースがHeise(ドイツ)にあります。通常の解決策(偽サイトの報告は別として)は、クローラーのIPアドレスに特別なコンテンツを提供することであるため、たとえば実際のサイトへのリンクを表示します。
martinstoeckli 14

1
Googleがウェブスパムに対して厳しい姿勢を取っている今、将来のもう1つの心配は、競合他社が悪評のサイトに故意にコンテンツを投稿して、評判を傷つけることです。または、知らないうちに自分のサイトを指しているスパムのようなブログを投稿します。
マールボログッドラック14

3
@Jarrod Roberson:実際には、誰もが訴訟について知っているわけではありませんが、技術的解決策はいくつですか?!
machineaddict

1
@JarrodRobersonしかし、それはウェブマスターだけが直面している問題であり、したがって、ここでそれを尋ねると、それを処理しなければならなかった人々から応答を得るため、このサイトにとって非常に話題になります。また、人々は法的解決策とともにいくつかの技術的解決策を提出しているようです。
14

回答:


45

プロキシスクリプトを介してサイトをフィードするか、HTMLの言語を逆流してサイトをミラーリングしているだけの場合は、ページに正規のURLを追加できます。これにより、コンテンツが元のソースであることがGoogleに通知され、検索結果にURLではなくURLが表示されます。

GoogleにDMCAリクエストを送信します。それらは少し遅いですが、最終的にそれらのページをインデックスから削除します。

リンクを否認することは賢明な動きです。

ただし、ユーザーをブロックすることが役立つかどうかはわかりません。ページの上部にあなたが元のサイトであり、他のサイトが詐欺であることを知らせるメッセージをページの上部に置くことは、より良い解決策かもしれません。


2
正規URLは必ずしも役立つとは限りません。私のサイトをミラーリングしたスクリプトは、正規のURLも偽のサイトを指すように変更しました。だから無意味だった。
キャプテンコードマン14

28

DMCAの苦情を申し立てることができます。米国にいる場合は、著作権の民事訴訟を起こすことができます。

DMCAの苦情がどのように役立つかを説明する短い回答へのリンクを次に示します。

DMCAの苦情を申し立てるには、米国にいる必要がありますか?

...そしてもう1つはさらに説明しています...

DMCA苦情を申し立てる前に、どのくらいのコンテンツをコピーする必要がありますか?

米国にいる場合は、著作権の問題に精通している弁護士を雇い、彼らに停止と破棄の手紙を送ってもらうことができます。コンテンツを削除するには、それらに10日間(営業日ではなく実日ですが、営業日でも問題ありません)を与えます。あなたの証拠のために問題のあるサイトのスナップショットとあなたのサイトのスナップショットもキャプチャしたいと思います。ページが削除されたかどうかを確認する場合は、検索結果ではなくサイトを直接確認してください。

期間内にページが削除されなかった場合、連邦民事訴訟を起こすことができます。これには、防御のために少なくとも10,000ドルかかり、費用はほとんどかかりません。あなたは運転席にいます。少なくとも1万ドル以上、場合によってはそれ以上で決済が行われる可能性があります。費用を取り戻すこともできます。重要なのは、問題を修正するための無料のオプションを提供することです。その後、被告に責任を負わずにケースを提出することは明らかです。

もう1つの注意点は、裁判所に行く場合は損害賠償を示す必要があるということです。検索トラフィックの損失は損害です。ここでは、弁護士と協力してトラフィックの損失を示す指標を収集し、そのトラフィックの価値を収益化する必要があります。もちろん、ここでは、コンバージョン率が100%であっても、より高い数値を想定できます。念のために、Google Analyticsとログファイル分析ソフトウェアを使用して、現在および将来のトラフィック損失に関するメトリックを収集します。

ケースを提出することは、特に現在および将来発生している損害と比較して、困難でも非常に高価でもないことを知っておいてください。著作権の侵害は最近減少していますが、最近では著作権を侵害する少数のものがより大胆になっています。これらの人々を止める必要があり、唯一の本当の方法は、著作権侵害を非営利にするビジネス戦略にコスト要因を入れることです。


2
あなたが避けている問題全体は、サイトの背後にいる人を見つけることは事実上不可能だということです。つまり、サイトを実際の個人に簡単にさかのぼることができるように、彼らはばかである必要があります。
デビッドモルダー14

1
@DavidMulder脇道はありません。弁護士は、必要な情報を求めて企業を召喚できます。親切な手紙でも十分です。情報が提供されない場合、弁護士は、裁判官が現れない場合は刑務所の刑を科せられるか、要求された情報を提供しない場合、裁判官の前で法廷への寄託を要求できます。米国では、法律やその他の方法からの隠蔽はありません。これは、いくつかの例外を除き、依然として国際的に機能します。
closetnoc

@closetnoc:会社は情報を自由に提供したくないかもしれませんし、そうすることもできません。裁判所が召喚状を発行すること、または証跡がその管轄権に留まることは確実ではありません。あなたは、犯罪者の本名さえ知らないかもしれない第三者との非常に高価で長い法廷闘争に自分自身を見つけるかもしれません。あなたの完全な答えから判断すると、これらの障害を疑う余地なく知っていますが、私はデビッド・モルダーに味方しなければなりません。
マルクストーマス14

@closetnoc:ええ、ホスティングプロバイダーが正しい情報を持っていません。そして、支払いはおそらくプリペイドクレジットカードまたは他のプリペイドカード、盗まれたクレジットカード、ビットコインまたは他の追跡不可能なトランザクションメカニズムで行われました。ああ、そもそもホスティングプロバイダーは米国にいないかもしれません。好むと好まざるとにかかわらず、インターネットと呼ばれています。
デビッドモルダー14

@DavidMulderあなたが言っていることに感謝します。私は、特に悪意のある人物を見つける方法に関する研究の分野で、セキュリティ事業に携わっています。あなたが話していることのほとんどは、中国語、ロシア語、またはポーランド語です。それでも、パターンなどを通じて、これらの人々が誰であるかを判断する方法があります。彼らは自分自身を与えます。これは具体的に私がやっていることです。やってみなきゃ。ロールオーバーすることはできません。優れたインターネット弁護士は、私のような人々と情報の入手方法を知っています。必要なのは1つのスレッドだけで、通常は入手できます。しかし、それは本当の努力です。しかし、それは最悪のシナリオです。
closetnoc

27

IP(またはIP)を追跡し、まったく異なるコンテンツを返してミラーリングすることができます。このようにして、広告を掲載するための空きスペースを確保し、Googleでの高い地位を活用できます。

私はかつてこれを使用して、ミラー化されたWebサイトのユーザーに、これが間違ったドメインであることを簡単に説明しました。単純なHTTPリダイレクトヘッダーを投稿することもできます。


8
実際、これはなんらかの理由でかなりおもしろいと思います。+1
Mehrdad 14

1
彼らはおそらくHTTPヘッダのクローンを作成しませんが、あなたは彼らに「これは盗作である」と古き良きアニメーションGIF叫んでJavaScriptのアニメーションや面白いマーキースタイルバナー送ることができます:P
フロリアンのFida

メタタグとJavaScriptリダイレクトも使用できます。3つのうちの1つはほぼ確実に機能します。いずれにせよ、これは安定した解決策ではなく、彼らがそれを見つけ出し、それに対して作業を開始するまでしか機能しません。@Mehrdad、ハッキーだから面白いと思う:)
イゴールR 14

また、攻撃者は、攻撃者が自分の(攻撃者)の遊び場にいつでも止められたとしても、攻撃者に実際に脆弱性を公開しているため、おかしいと思いました。これにより、攻撃者はかなり愚かに見えます。
イゴールR 14

Googleでの彼らの高い地位は、元のウェブサイトの高い地位に取って代わり、それは本当に「無料の広告」ではありません。
キャプテンコードマン14

12

あなたには少し遅れましたが、あなたのウェブサイトを保護するための最良のアイデアは(将来)これでしょう:https : //www.youtube.com/watch? v=I3pNLB3Cq24(defcon 21、数字による防御)コンテンツは表示されますが、ボットは表示されます

  • コンテンツを捨てる
  • 円を描く
  • 仕事をやめる

その他の考えられるアイデア-ユーザーが次のいずれも表示しないようにしてください。

  • GBの情報を保存できるようにします(サーバーには数KBしかありません)
  • ボットに偽のリンクで自分のメモリをあふれさせる
  • 偽のコンテンツを送信する(100%boolsh * t-「オバマ妊娠中」、「スパイダーマン5-来年の夏」のようなものを書く必要があります...
  • 偽のファイルを送信します(42.zipなど、コピーされたコンテンツをチェックしない場合、ユーザーは楽しんでいます-> AVツールは何かが間違っていることを示します->ユーザーはp * ss * d ...)
  • より多くのデータを待機させます(ファイルサイズ= 1〜10 MB、1バイト/秒以下のランダムcr * pを送信します)

他のアイデア:

  • Javascriptで保護されたリンク(古い、もう使用しませんか?ただし、変更されていない場合、ユーザーは(しばらく)あなたに送信されます)
  • 動的なゴミ(コメントまたは非表示のアイテムを使用して、ボットにユーザーが見ることができないものをダウンロードさせる-良いボットはこれに該当しません)
  • ダウンロードが多すぎる/速すぎる/間違った方法でIPアドレスをブロックする(ボットは人間のように振る舞わない1)各ページのすべてのリンク2)次のリンクを選択する方法にパターンまたは完全な混乱がある
  • ファイルがサーバーによってホストされていない場合は、JavaScriptを使用してサーバーにリダイレクトします(盗難に対する助けはありませんが、泥棒はそれを削除する必要があります。 ))

スパイダーをブロックするいくつかのコードを調整する必要がある独自のコードがあります。私はあなたのアイデアを探しています。それは私がそういう人だからです!;-)すばらしいヒント!
closetnoc

4
スパイダーとボットをブロックすることの問題は、おそらくそれらすべてをブロックしたくないことです。たとえば、人々があなたのウェブサイトを見つけられるようにしたい場合、グーグルはとても重要です。(そして、Googleはあなたのサイトをキャッシュに持っているので、Webクローラーが実際にサイトをクロールして複製する必要はありません)。
trlkly 14

意図的に代替物を提供する場合は、反論するよりも、イゴールの有益な回答(リダイレクト/間違っている/ホスト広告)を好む。
OJFord 14

2

これはGoogle Proxy Hackと呼ばれ、私にも起こりました。

まず最初に:

  • DMCA苦情をWebホストに送信します。このリンクを使用して、正しく形成された苦情を作成し、ホストのサポートまたは悪用メールに送信します。ホストが米国にいる場合、サイトを停止する必要があります。米国に拠点を置いていない場合でも、とにかくサイトを削除することを選択できます。(それは一度私に起こりました。)
  • Google DMCAツールを使用して、ミラーリングされたURLを検索結果から削除するようリクエストします。
  • Googleのアルゴリズムの障害を報告するには、Googleのスクレイパーレポートを使用します

基本的に、これはGoogle側の失敗です。「質の高いオリジナルコンテンツ」に基づいたランキングについて彼らが言うことはすべて、これは非常に単純な反例であり、率直に言って恥ずかしいことです。

十分な人が文句を言ったら、最終的にGoogleが行動をまとめ、サイトが以前に確立されたサイトの正確なミラーであることを確認するために必要な10行のコードを書きます。

また、この場合、正規URLを使用しても常に機能するとは限らないことに注意してください。これらのプロキシスクリプトの多くは、正規URLをミラーサイトを指すように変更するため、役に立たなくなります。

最後に、彼らはあなたのランキングを損なうためにあなたのメインサイトをゴミリンクでスパムしているかもしれないことに注意してください。(これは私にも起こりました。)

検索と創造的な思考を行う場合、反撃する方法がいくつかあります。完全なリストをここに公開することは、ハッカーの生活を楽にするだけなので、本当に良いとは思いません。


1

他の人が述べたように、DMCAの苦情と著作権の民事訴訟を提出することが最良の選択肢かもしれません。

公開する新しいコンテンツについては、投稿するとすぐにソーシャルメディア(Twitter、Facebookなど)でサイトの更新について通知することを検討できます。そこに記録されたタイムスタンプは、それを証明する必要がある場合に備えて、最初に書いた公正な指標になる可能性があります。Googleウェブマスターツールを使用して、Googlebotがサイトを頻繁にクロールするよう設定することができます。人気のある検索エンジンが定期的にWebページのインデックスを作成すると(サイトオペレーターsite:example.comを使用して検索)、キャッシュされたコピーの日付を、コンテンツが公開されたときの大まかなインジケーターとして使用できます。

また、公開する新しいコンテンツに対して、画像内に透かしを埋め込み、JSファイル内にコメントを配置して、それらのファイルの元の所有者であることを示すことができます。


コンテンツをコピーするボットがある場合、ページに著者情報を含めることができるため、コピーされたコンテンツには「これはFooによって作成され、すべての権利が留保されます」などのようになり、非常に明確なケースになります(たとえば、隠すことができます)アクロスティックではあるが、ボットであるため、プレーンテキストで機能し、ケースを強化します)。
アンヘル14
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.