サイトマップファイルが有益であることを示す明確な指標はありますか?


73

最近、sitemap.xmlファイルを作成し、それをGoogle Webmasters Toolsアカウントにアップロードしました。Googleは、私のサイトのアップロードされたサイトマップに関する問題やエラーを報告しませんでした。

今私の質問は:

  • サイトマップがGoogleウェブマスターツール内で機能しているかどうかを確認するにはどうすればよいですか?

私が尋ねる理由は、私が見たり探したりしようとしているものが何なのかわからず、役に立たないファイルをアップロードしたような気がするからです。

回答:


93

サイトマップファイルはする検索エンジンを支援し、新規および更新されたURLを発見し、あなたのウェブサイトで。特に、あなたのウェブサイトがかなり大きい場合、これは、何かを変更するためにすべてを盲目的にクロールする代わりに、新しいコンテンツと更新されたコンテンツに集中できるようにします。その結果、新しいコンテンツがはるかに高速に検出される可能性があります。これは、特にサイトが大規模で複雑な場合に顕著になります。

特にGoogleでは(私はGoogleで働いています。他の検索エンジンがこれらをどのように処理するかわかりません)、次のことも行います。

  • Webサイトのインデックス付きURLの数を確認します。これらの統計は毎日再計算され、非常に正確です。これらはサイトマップの詳細ページで見つけることができます
  • 正規化の問題を発見する:数値が一致しない場合、それはサイトマップファイルでクロール中に見つかったものと一致しないURLを指定していることを示しています。これは通常、正規化に取り組む必要があることを示しています。
  • 正規化の支援:同じコンテンツを示す複数のURLがサイトで見つかった場合、他の正規化方法を使用しなくても、サイトマップにリストされているURLに余分なエッジを追加します。
  • サイトの不適切にインデックス付けされた部分を見つける:これらのカウントはサイトマップファイルごとに提供されるため、サイトの論理セクション用に個別のサイトマップファイルを作成して、Googleが必要なだけインデックス付けしていない領域を見つけることができます。
  • クロールエラーに優先順位を付ける:ではクロールエラーのセクション、サイトマップファイルで指定されたURLは、個別に記載されています。これらのURLを明確に指定したため、インデックスを作成し、そこにあるクロールエラーが重要であると想定しています。

さらに、サイトマップファイルでいくつかの拡張機能を使用できます(画像、ビデオ、ニュース、国際化など)。これらの拡張機能はすべてオプションです。

ほとんどのウェブサイトで、サイトマップファイルの最も目立つ要素は、インデックス付きURLカウントを表示できることです。表示されるまでに1日程度かかる場合があるため、初めてサイトマップを送信したばかりの場合は、少し我慢する必要があります。他の方法(例:site:-query)は非常に大まかな近似ですが、このカウントは非常に正確です。

編集して追加:サイトマップに関して私が個人的に非常に役立つと思うもう1つのことは、CMSで直接生成しない場合、常にWebサイトがどのようにクロール可能か、どのようなURLが検出されるかについて多くのことを知ることですそのプロセス中に。サイドのツール(サイトマップジェネレーターなど)を使用してWebサイトをクロールすると、URLのセッションID、URLの違いによるコンテンツの複製、無限のスペース(たとえば、無限のカレンダーとして)、またはまったくリンクされていないサイトの一部です。


素晴らしい情報。また、トラフィックの多いクロールされたサイトでは、Googleがより良いクロールを行うため、サイトマップを使用しないほうが良いと聞きました。
Chris_O

3
@Chris_Oさまざまな問題を一緒にマッシュしている。その例では、Googleが単独でクロールする「より良い」仕事をしているわけではありません。サイトマップ自体に欠陥があります。これは、「サイトマップをまったく使用しない」という直接的な議論ではありません。その状況の解決策は、サイトマップを修正することです。さらに、サイトマップは情報を提供するものであり、ディレクティブではありません。サイトマップに足りないものがあるからといって、Googleがサイトマップを見つけられない、または無視しないというわけではありません。
蘇」

問題のサイトには4万件以上のインデックスページがあり、新しいコンテンツは5分以内にインデックスされます(サイトマップはありません)。あなたの答えに基づいて、私たちはそれらを構築し始め、それらを数年に分けます。
Chris_O

@ john-muellerこんにちはさん m。-一度、1000個のURLを含むテストサイトマップを送信すると、約700個のインデックスカウントが返されました。 700のURL(200の地域でさらに多く)の下のカウント方法。これは何を意味するのでしょうか?
フランツ

2
@Franz site:-queriesでインデックス付きURLカウントを再現するのを難しくする詳細が含まれることがあります。たとえば、複数のURLを組み合わせて、site:-queryに対してそのうちの1つだけを表示する場合があります。そのため、そこに違いが見られる場合、通常は心配する価値はありません。
ジョンミューラー

6

エラーが発生していない場合は、Googleがそれを解析し、内容を認識していると想定できます。しかし、それは、それらがそれらのページをクロールおよび/またはインデックス付けすることを意味しません。サイトマップは、ページについて検索エンジンに伝えるための別の方法です。これらのページの一部またはすべてをクロールおよびインデックス登録する義務はありません。同じことが、リンクまたはURLの送信を通じてページを見つける場合にも当てはまります。


1
追加情報として、Googleがサイトマップを理解しているかどうかを確認するのは非常に簡単です。[最適化]-> [サイトマップ]で確認します。サイトマップで送信されたURLの数がわかります。サイトマップはコンテンツを正常に読み取り、その中にこれだけのリンクが見つかりました。2番目の数字は、インデックスに登録された数であり、Johnが指摘するように、価値のあるコンテンツがまったくないか、いくつかあるか、ほとんどあるかをGoogleが完全に判断します。それは常に送信された金額よりも少なくなります。Googleは一部のページをそれほどホットではないと判断し、気にしません。
Fiasco Labs

1

質の高いリンクが多数ある場合、Googleは通常、ウェブサイトを適切にクロールします。インデックスに登録したページ数を見るのに多くの時間を費やしている場合は、サイトを改善し、質の高いリンクを取得することをお勧めします。


0

このようなサイトマップ検証ツールかもしれませんが、サイトマップが作動し始めるのを見たことはありません。


ファイルはすでに検証されています。それは問題ではありません。

0

数百、数千、数百万ページのウェブサイトなどの大規模なウェブサイトでは、非常に便利です。会社のサイトには、URLがコンテンツIDによって動的に作成され、URLパラメーターが&で使用された400 000ページがありました。Googleウェブマスターツールは、クロールされたページに関するフィードバックを提供し、エラーを表示し、ページをデバッグまたは開くことができます。何が悪いのか自分で確かめてください。このように、Googleは実際に私たちがより良いウェブサイトを作るのを助け、何度か大きな恥ずかしさから私たちを免れました。

また、インデックス登録されたページの数とクロールされた数を確認すると便利です。

小規模なWebサイトの場合、Webサイトが.htmlページの小さなグループであり、各ページがメニューを介してリンクされ、サイトが頻繁に更新されない場合、サイトマップをアップロードしても、検索結果に対して何も変わりません。サイトマップをアップロードしていない人よりもサイトマップをアップロードする利点はありません。

また、約20の小さなWebサイトがありました。そこでは、cronスクリプトによって自動的に生成されたサイトマップがあり、それをやめました。ある日、私はミスによってXMLファイルが約6か月間正しく生成されないことを発見しましたが、Googleはありがたいことに私の間違いを無視し、サイトマップにエラーがある場合でもこれらのWebサイトを完全にインデックス付けしました。非常に真剣に。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.