URLパラメータ「?chocaid = 397」はどこから来たのですか?


9

Googleウェブマスターツールで、フロントページが2回インデックスに登録されていることに気付きました。

  • example.com/
  • example.com/?chocaid=397

link typeを使用してこれを修正できることは知ってcanonicalいますが、このパラメータはどこから来たのでしょうか?

この非常にパラメーター/値でインデックスが付けられたページがあるさまざまなサイトがあります:https : //duckduckgo.com/?q=chocaid%3D397

これらのサイトの類似点を探しました。しかし、決定的なものを見つけることができませんでした。それは多くの場合、最初のページですが、すべての場合ではありません。一部はNSFWですが、すべてではありません。1つのドメインのURLにこのパラメーターがある場合、多くの場合、同じドメインの他のサブドメインにもこのパラメーターがあります。

ウィキペディアのエントリ

ここに画像の説明を入力してください

Microsoft Codeplex

ここに画像の説明を入力してください


Googleウェブマスターツール(またはリファラーログ)で、このURLにリンクしている可能性のあるページを特定できますか?
MrWhite

@ w3d:どのログにもアクセスできません。GWTでは、「HTMLの改善」→「繰り返しページタイトル」に記載されていました。ですから、私はリファラー情報を得ることができないと恐れています。
unor

[トラフィック]> [サイトへのリンク]> [最もリンクされたコンテンツ]> [もっと見る](すべてのリンクされたページを取得する)の下に何かあるのかと思いました。以下のために?chocaid=397、次にインデックスを取得するために、おそらく何かが最初の場所でのリンクを見つけるためにGoogleのためにそれにリンクされて?
MrWhite

@ w3d:ああ、なるほど。残念ながら、このレポートのデータはまだありません(おそらく、まだ数日間だけGWTを使用しているためです)。
unor

これが役立つかどうかはわかりませんが、数値397はハッシュと関係があります(ここここを参照)。これがこの質問と関係があるかどうか?chocaid=397はわかりませんが、ハッシュをいじくろうとする試みのようなものである可能性があります(これについてはあまり知らないので、これについてはわかりません)。また、これは素晴らしい質問です。

回答:


1

ドメインはどれくらい新しいですか?これは古いドメインで人気のあるクエリだったので、まだ「訪問者」を獲得しています。これは有効なページまたは404にマッピングされますか?そこに多くのヒットがあり、それが404である場合、私はそれをあなたのホームページまたは何かに再マップします(.htaccessを使用)。


1
まだ訪問者に気づいていませんでした。Googleがインデックスに登録したページを見ました。同じフロントページにマッピングされます(パラメーターが省略されているかのように)。私はそれをリダイレクトしたりを使用したりできることを知っていますcanonicalが、この質問はこのパラメーターの起源についての詳細です。
unor

2
しかし、これは他の多くのドメインの検索結果に同じURLパラメータが表示される理由を説明していません。
MrWhite 2012年

1

GooglebotがjQuery / Javascriptにアクセスし、可能な限りすべてをクロールしようとしている可能性があります。Googlebotがサイト上の無効なURLをクロールしていたために誰かが助けを求めているという最近の投稿がここにありました。John Mは、GooglebotがサイトのスクリプトからクロールするURLをさらに探す方法について回答しました。彼はGoogleウェブマスターツールで働いています。canonicalタグを設定することで、自分の質問にほとんど答えました。


1

明確な答えはありませんが、これを調べていると、絞り込みに役立つ可能性があるいくつかのことがわかります。

  • リンクはBingとYahooにも表示されるため、Googleとは関係ありません。
  • Wiki、Tumblrブログ、Wordpressブログ、その他のサイトに表示されるため、特定のソフトウェアのエクスプロイトを介して追加されることはありません。
  • それらはいくつかの非常に低品質のTumblrサイトに表示されるため、これらのサイトに広告が表示されることはほとんどありません。同様に、ウィキペディアの記事が広告で宣伝されることはほとんどありません。

私の推測では、見つけたすべてのリンクにこのURLを追加するスクレイパーサイトがあるか、そうでした。確かに、外部リンクはそれらがどこから来たのかについて最もありそうな説明のように思われ、ディレクトリはそれが非常にランダムなページに追加されているという事実のためにありそうにありません。


0

これはあなたが持っているかもしれない広告プロバイダーからのものかもしれません、私は同じ問題を抱えており、それが発生する唯一の可能性のある場所は、JavaScriptコードを通じていくつかのマルウェアを注入する広告プロバイダーからのものです。


このための情報源/証拠はありますか?このパラメーターで索引付けされたWikipedia がいくつかあるため、Wikipediaがこれに感染していることを意味します。
2014

私はGoogleがこれまでと犯人の広告を除去した後によりブロックされたというブログを持っているので、うん、彼らはブロック削除するために始めた
レイマンド
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.