Googleクロール統計について


11

2011年1月にウェブサイトを立ち上げ、Googleでインデックスに登録されています。これまでに約300ページのコンテンツがあります。6月の終わりと7月の初めにクロール統計がどうなったかを理解しようとしています。大規模な上昇の原因は何ですか?どういう意味ですか?他に何かすべきことはありますか?


ここに画像の説明を入力してください

回答:


2

サイトが過剰にクロールされていると思われる場合(おそらく、より深いコンテンツが欠落している場合もある)、HTTPヘッダーが「最終変更」時間などの適切な値を返していることを確認する必要があります。Googlebotがサイトの変化量を過大評価している可能性があります。おまけとして、あなたのサイトは(それがプロキシであろうとブラウザベースであろうと)キャッシングに関してより良く振る舞うので、少し速く感じるでしょう。

クロールされているURLを(サーバーログを確認することで)調査することをお勧めします。同じURLを何度も再クロールする場合は、間違いなく問題があります。これの一般的なバリアントは、リクエスト変数を使用してさまざまな方法で表示できるページがある場合です。Googlbotは、これらの変数のすべての可能な組み合わせをクロールしようとする可能性があります。

私がクロールオペレーターとして遭遇した例は、20の見出しのリストがあり、それらの任意の組み合わせを展開できるページでした。基本的に、そのページには2 ^ 20の異なるURLがありました!

Googlebotが基本的に同じページを何度も何度もクロールしないように注意してください。


そのおかげで、今日は別の「急増」があったことに気づき、Googleのクロール統計が1,000ページのコンテンツをクロールしたため、さらに懸念が高まっています-私は300ページしかありません!Googleが何度もクロールしているページを確認するにはどうすればよいですか。また、HTTPヘッダーが適切な値を返していることを確認するにはどうすればよいですか?テストアプリがありますか?
Ubique 2011

サーバーログでは、Googleがクロールしているページがわかります。HTTPヘッダーに関しては、いくつかのFirefoxプラグインがあります。個人的にはFirebugを使っています。
クリス

1

Googleは、サイトの年齢、人気(サイトへのリンク)、マークアップとヘッダー、適切なサイトマップなどによってクロール速度を変更すると思います。また、以前にクローラーを変更したため、コンテンツが以前よりもはるかに速く検索結果に表示されるようになりました(変更の少なくとも2週間前)。

そのため、2年前にブログをリリースしたとき、すべてのコンテンツをインデックスに登録するには数ヶ月、新しい投稿をインデックスに登録するには数週間かかりました。今、私はそれを公開したその日に検索結果に投稿を表示します。

簡単なことですが、Googleは新しいサイトが好きではなく、長老を尊重しています。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.