私のウェブサイトからページランクを盗むために悲しみ?


8

私は今日、自分のウェブサイト用のGoogleウェブマスターツールを探していたところ、ウェブサイトの次のページに重複したタイトルが表示されていました(私のサイトインデックスにある多数のサンプルのうちの小さいサンプル)。

/?title=3_Misconceptions_Regarding_Traumatic_Human_brain_Injury365
/?title=3_or_more_Misguided_beliefs_Pertaining_to_Disturbing_Head_Incidents2902384
/?title=A_Listing_Of_Successful_Web_Marketing_Tips_For_EveryoneHelpful_Online_Marketing_Methods_For_Easy_Success
/?title=Adhere_to_This_kind_of_Online_marketing_Guidance_To_develop_Your_Business

これらは確かに私が作成したページではありません!

私は自分のサイトで作成した構造化データも見て、これを見ることができます(多くの中から小さなサンプル):

Structured Data > __sid=11 (Markup: kualalumpur.yalwa.my)
Structured Data > __sid=7 (Markup: www.locanto.cn)

これは私がしたことの結果ではありません。明らかに、ページランクを盗むためのある種の悲嘆または精巧な計画です。

昨日、すべてのページにphp自動化された301リダイレクトとカノニカルをインストールして、これを強化しようとしました(スタックオーバーフローの人々からのすばらしい助けのおかげです)。しかし、私はこれと彼らの目的が何であるかについてもっと理解したいと思います。


1
あなたはページタイトルを作成していませんが、あなたが作成したものであるこれらのページですか?他の人があなたのサイトなどにページを作成することを許可していますか?現時点では誰もが推測しているので、問題のサイトについて詳しく教えてください。それはマルウェアかもしれませんし、コンテンツ管理システムが異なるタイトルの複数のURLを与えているかもしれません。それはあなたの評判を傷つけようとしている人々かもしれません(疑わしい心)。あなたの質問を編集して、あなたが運営しているサイトについてのより良いアイデアを教えてください。私が述べたキーポイントとともに、問題のサイトへのURLはそのようなトピックで長い道のりを進んでいます。
Simon Hayter

これらは私が作成したページではありません。私のウィキでは、未作成のページを表すために指定されたページがあり、404エラーが表示されないことに気づきました
Amy Neville

構造化されたデータはまったく変ですが、どこから来るのかまったくわかりません。
エイミーネヴィル2013年

1
こんにちはエイミー、私は取りつかれていると思います、そしていくつかの調査作業は私があなたのために答えを持っていると思いますが、あなたはそれが好きではないかもしれません;)
サイモン・ヘイター

1
こんにちは。Googleウェブマスターツールチームと協力しています。これは、構造化データテストツールとウェブマスターツールの適切なダッシュボードにのみ影響する、私たちの側の問題でした。それはウェブ検索に影響を与えませんでした、そしてこれはおそらくあなたのサイトで発見されたものではありませんでした。混乱させて申し訳ありません!
John Mueller 2013年

回答:


6

存在しないページがGoogleのインデックスに登録されるいくつかの方法

存在しないページがGoogleやその他の検索エンジンに表示される3つの方法があります。これらは次のとおりです。

  • あなたのページはこれらのページにリンクしています。(これは、サイトマップ、プロフィールページ、ブログのコメント、またはリンクに基づくhrefにある可能性があります...)たとえば、WordPressのプラグインの1つで開発され、次にアップロードされたため、このようなリンクが含まれていますプラグインライブラリですが、開発者はプラグインに出くわしたキャッシュセットアップを持っています。

  • バックリンクがこれらのページを指しています。

  • 単に存在しないGoogleのインデックスページと文字列を見たことがありますが、あなたのページには、Googlebotがどのようにそれらを思い付くのかわからないような言葉が含まれているようです。

内部リンク

私はあなたのタイトルページをグーグルで検索し、私が見つけたすべてはこのページとあなたのサイトをイメージする別のサイトである3ページでした。そのため、誰かがこのリンクを作成したか、アプリケーション/プラグイン/マルウェアが作成したようです。

調査中

したがって、ユーザー、自分自身、またはアプリケーションがこれらのリンクを作成したことを除外するには、SQL(理想的にはPHPMyadmin)にログインして文字列を検索する必要があります。データベースでこれらのページが削除されていることを確認してください。キャッシュファイル、およびこれらのページのphpファイルを検索する時間はありません。何も見つからない場合は、誰かがあなたにもリンクしているためであり、削除されたためにGoogleに登録されていない可能性があります。

/?文字列をリダイレクトすると、誰かがyaを取得するために有害な場合があります

これで、すべての/?title=文字列が削除されてホームページにリダイレクトされたことがわかります。これは問題ありませんが、同時に害を及ぼす可能性もあるため、説明します。

誰かが厄介なバックリンクでサイトをスパムしている場合、Googleがこれをページランクの操作と見なす可能性があるため、ホームページにリダイレクトするのが最悪の場合です。これは、301が外部リンクからジュースのフローをリダイレクトするためです。そのリンクがViagraサイトである場合、リダイレクトでGoogleに誤った指示を与えると、これが戻ってあなたを噛む可能性があります。

古き良き404を愛するようになった

単に存在しないページで行う正しいことは、404を使用することです。これらは完全に正常であり、Googleにサイトが壊れているような印象を与えることはありません。存在しないページがGoogleのインデックスに登録されることは決してなく、存在しないページへのバックリンクは、404が返された場合でもサイトに害を及ぼすことはありません。

1〜2年前は文字列リダイレクトが最善の方法だと思いますが、Googleのパンダとペンギンの更新以来、オンラインの評判を傷つけようとするあらゆる試みのサイトを見てきました(基本的にパンダ、ペンギンはスパムバックリンク、有料リンクについてサイトを罰します)および一般的に関連性のないリンク)Googleはオンラインで他の人の評判を損なうことは不可能であると主張しているが、これが本当である場合、なぜ現在多くの人が他人をスパムしているのか、そしてウェブマスターが自分のランキングを操作しようとしているのではないことをどのようにして知っているのかという疑問を提起する?議論の余地のある領域ですが、まとめましょう...この状況では404が最適です。

クエリの編集/は、文字列を削除してから301にリダイレクトするのではなく、まっすぐ進む必要があります/404/


私は投票を許可しませんが、それは素晴らしい答えのおかげです
エイミーネヴィル2013年

まったく問題ありません。すべての看板にラッキーチャームを追加してください;)
Simon Hayter

@SimonHayter Googleは404 HTTPレスポンスを取得し、ページコンテンツを無視しますか?JavaScriptがホームページにリダイレクトする404ページについてどう思いますか?その意味に興味がある
ジョナサン
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.