私のWordPressブログは完全に複製されています。そのクローンサイトは私のブログでリアルタイムに更新されています。誰かが実際にそれを行うことができるのに驚いています。
検索エンジンのランキングへの悪影響を防ぐにはどうすればよいですか?そのサイトをインデックスに登録しないようにGoogleに指示する方法はありますか?
私のWordPressブログは完全に複製されています。そのクローンサイトは私のブログでリアルタイムに更新されています。誰かが実際にそれを行うことができるのに驚いています。
検索エンジンのランキングへの悪影響を防ぐにはどうすればよいですか?そのサイトをインデックスに登録しないようにGoogleに指示する方法はありますか?
回答:
彼らは単にサーバー側のスクリプトを介してあなたのサイトをロードしています。必要なのは、.htaccessを介してサーバーのIPアドレスをブロックすることだけです。単にサーバーのアクセスログを開き、サイトのクローンページを開いて、新しいエントリのログを表示すると、IPアドレスがわかります。
また、GoogleにDMCAリクエストを送信しても害はありませんが、IPアドレスをブロックするとコンテンツがすぐに消えるため、これは実際には必要ありません。
(@Johnの回答に加えて。)
そのサイトをインデックスに登録しないようにGoogleに指示する方法はありますか?
ながら、むしろ好奇心という彼らはクローン化されているように見えるすべてのもの(あなたのXMLサイトマップを含む* 1)、彼らはあなたのrobots.txtファイルを複製していません。実際、そのサイトのrobots.txtは、すべてのクロールを積極的にブロックしています。したがって、この点で行うべきことは何もないようです。そのドメインでサイト検索を実行すると、ベアドメインとrobots.txtによってブロックされていることを示す通知のみが返されます。
(むしろ、彼らがこれを行うことの意図が何であるかに興味がありますか。おそらく、彼らがrobots.txtで間違いを犯したと思い込んでいる可能性があります。
また、XMLサイトマップが複製されている間、それらは(メインサイトページで行っているように)それらのURLを更新していません。
* 1 XMLサイトマップについて。あなたのサイトでは "sitemap.xml"は実際には "sitemap_index.xml"へのリダイレクトであり、複製されたサイトは実際にリダイレクトを複製しています...これはあなたのサイトにリダイレクトします!(確かに彼らの間違いです。) "sitemap_index.xml"は単なるインデックスであり、他の4つのサイトマップにリンクしています。これらの実際のサイトマップのいずれかが複製されたサイトで直接要求された場合、それらは正しく複製され、URLが更新されます。ただし、「sitemap.xml」が最初にリダイレクトされるため、これらのサイトマップは複製されたサイトで見つかる可能性は低いと言っていました。(?)「sitemap_index.xml」を直接送信した場合、それは明らかにリダイレクトを回避します。
サイトからバックリンクが生成される場合は、Google Disavowツールを使用することが重要です。それ以外の場合は、アルゴリズムが関係なく機能します。
https://www.google.com/webmasters/tools/disavow-links-main
.txtファイルを作成し、以下を追加します。
domain:thedamnsitethatcloned.com
次に、ウェブマスターツールを使用してGoogleにアップロードします。
この問題を解決するために私が実行する手順は次のとおりです。多くのウェブマスターがこの問題に直面していることを知っています。私は以前にこの問題に遭遇したことがあり、Google(皮肉なことに)に直接的な回答はないようです(そのため、私は手助けしたいのです)。マットカッツは、これらの問題について聞くべき人物ですが、彼を聞くことは、燃えている家の中でスーパーコンピュータに対してチェスのゲームを勝ち取ろうとするようなものです(助けが見つからない)。
短いカッツ:
私の最初の答えは、ドメインを否認することでしたが、否認する必要があることを忘れていました。
(Googleはそれらを2つの別個のドメインとして数えます)。