検索エンジンがコンテンツのインデックスを作成しないのはなぜですか?


29

これは一般的なコミュニティWiki キャッチオール質問と回答のペアで、サイトまたは特定のサイトコンテンツが検索エンジンの結果に表示されない理由に関する質問に対処することを目的としています。

あなたの質問がこの質問の複製として閉じられ、ここで提供された情報では十分な回答が得られないと感じた場合は、Pro Webmasters Metaでディスカッションを開いてください。

サイト(またはサイトの特定のページ)が検索エンジンの結果に表示されません。

コンテンツがインデックスに登録されないのはなぜですか?

回答:


36

コンテンツが検索エンジンの結果に表示されない理由はいくつかありますが、検索エンジンのインデックスには、結果ページに表示されないページが含まれている可能性があること に注意することが重要 です

コンテンツが実際にインデックス化されているかどうかを確認する方法

実際、コンテンツがインデックス化されているかどうかを判断するのは難しいかもしれません。

  • サイトのすべてのドキュメントを検索し、リストされているドキュメントの数を確認します
    • Google:入力site:example.comexample.comドメインはどこですか。コロンの後にスペースを入れてはいけません。)
    • Bing:入力site: example.com
    • Yahoo:入力site: example.com(または高度な検索フォームを使用)
  • 8〜12語の一意の文で特定のドキュメントを検索し、引用文でその文を検索します。たとえば、このドキュメントを見つけるには、「コンテンツが検索エンジンの結果に表示されない理由の数」を検索することを選択できます
  • 上記に加えて、を使用してキーワードを検索しinurl:intitle:次のようなことを試してください。keyword with another keyword inurl:example.comこれにより、指定されたドメインのみにインデックスが付けられたupiページが表示されます。

    • ウェブマスターツールにログインして、サイトからインデックスされたページ数に関する検索エンジン自体の統計情報を確認します
    • Googleウェブマスターツール -情報は[健康]»[インデックスステータス]で確認できます。サイトマップを送信した場合は、各サイトマップファイル内のドキュメントのインデックスが作成されている数も確認できます。
    • Bingウェブマスターツール

場合によっては、これらのメソッドのいずれかを使用してドキュメントがインデックス付けされていないように見えることもありますが、ドキュメントは他のメソッドを使用してインデックス内で見つけることができます。たとえば、ウェブマスターツールは、文章を検索して検索エンジンでドキュメントを見つけることができる場合でも、ほとんどのドキュメントがインデックス付けされていないことを報告する場合があります。このような場合、ドキュメント 実際にインデックス付けされます。

コンテンツのインデックス作成方法

検索エンジンがコンテンツにインデックスを付ける前に、Webクローラーを使用して検索する必要があります ウェブサーバーのログを調べて、検索エンジンのクローラー(ユーザーエージェント(GooglebotBing / MSNbotなど)によって識別される)がサイトにアクセスしているかどうかを確認する必要 があります。

GoogleやBingなどの大規模な検索エンジンは通常、サイトを頻繁にクロールしますが、クローラーは新しいサイトを知らない場合があります。サイトの存在を検索エンジンに通知するには、ウェブマスター(GoogleウェブマスターツールBingウェブマスターツール)として登録するか、検索エンジンがこの機能を提供しない場合、クローラーへのリンク(例:Yahoo)を送信します。

サイト/コンテンツはどれくらいの間オンラインになっていますか?

検索エンジンは、コンテンツが見つかった後、非常に高速にインデックスを作成する場合がありますが、これらの更新が遅れる場合があります。小規模な検索エンジンの応答性も大幅に低下し、新しいコンテンツのインデックス作成に数週間かかることがあります。

コンテンツが数日間オンラインになっていて、他のサイトからのリンクがない(または、クローラーが頻繁にアクセスしないサイトからのリンクである)場合は、おそらくインデックスに登録されていません。サイトが数か月以上稼働していない場合、検索エンジンは、サイトの多くのコンテンツをまだインデックスに登録するのに十分な信頼を得ていない可能性があります。

コンテンツはウェブマスターによって除外されていますか?

このステップは、他の誰かからサイトを引き継いでおり、特定のページまたはディレクトリに問題がある場合に特に重要です:robots.txt およびMETAロボットの 除外を確認し、 クローラーが除外されるコンテンツのインデックスを作成する場合はそれらを削除します。

コンテンツのインデックス作成を妨げる技術的な問題はありますか?

サイトが確立されているが、特定のコンテンツがインデックスに登録されていない場合(コンテンツが存在するURLでWebクローラーがヒットしない場合)、GoogleとBingが提供するウェブマスターツールは有用な診断情報を提供します。

Googleのクロールエラーの ドキュメントは、コンテンツのインデックス登録を妨げるウェブクローラーの一般的な問題に関する広範な背景を提供します。Googleウェブマスターツールを使用している場合、これらの問題がサイトで検出されるとアラートを受信します。

エラーと設定の誤りをできるだけ早く修正して、サイトのすべてのコンテンツがインデックスに登録されるようにします。

コンテンツは低品質ですか?

検索エンジンは、クロールするほとんどのページをインデックスに登録しません。最高品質のコンテンツのみをインデックス化します。次の場合、検索エンジンはコンテンツのインデックスを作成しません。

  • スパム、意味不明、またはナンセンスです。
  • 他の場所にあります。検索エンジンが重複するコンテンツを見つけると、インデックスに重複するものの1つだけを選択します。通常、それはより多くの評判とリンクを持っているオリジナルです。
  • 薄いです。数行の元のテキストが必要です。できればそれ以上。ユーザーごとのページなど、コンテンツがほとんどない自動作成ページは、インデックスに登録されることはほとんどありません。
  • 十分な評判やリンクがありません。ページがサイトの奥深くに埋まっているため、ランク付けできません。外部リンクがなく、ホームページからの数回以上のクリックがないページは、インデックスに登録されません。

一部のコンテンツはインデックス化されていますが、すべてではありませんか?

サイトに数百のページがある場合、Googleはすべてのページをインデックスに登録することを選択することはほとんどありません。サイトに何万ものページがある場合、Googleがそれらのページのごく一部のみをインデックス化することを選択することは非常に一般的です。

Googleは、サイトの全体的な評判とコンテンツの品質に基づいて、サイトからインデックスを作成するページ数を選択します。Googleは通常、サイトの評判が高まるにつれて、時間の経過とともにサイトの大部分をインデックス付けします。



1

上記と同じことを繰り返す必要はないと思いますが、新しいツールに慣れていない場合は、以下で確認できます。

古いGoogleウェブマスターの robots.txtテスターツールにアクセスして、robot.txtファイルがコンテンツをブロックしていないかどうかを確認できます

ここに画像の説明を入力してください

Google Search Console(新バージョン)

Google検索コンソールは、古いバージョンよりも貴重な情報を提供します。ページがクロールされているかどうか、インデックス付けされているかどうか、公開されているかどうか、問題がある場合は、Google Search Consoleから直接問題を確認してください。

  1. ウェブサイトのGoogle Search Consoleにログインします
  2. 複数のドメインプロパティがある場合は、目的のプロパティを選択したことを確認してください。

Googleウェブマスターの非推奨ツール

これは今では時代遅れです

これが、新しいSearch Consoleの使い方です。

新しいGoogle Search Console


0

ルートディレクトリにrobots.txtファイルがある場合は、サイトのインデックスを作成しないようにGoogleに指示している可能性があります。

確認しましたか?

通常、これらのファイルを削除(または名前変更)するだけで、インデックスを作成する必要があるように聞こえます。

重要: これは、Google Adsenseをサイトで機能させようとしている場合、契約違反になる可能性があります。

特別なコードをどこに配置しても、インデックスが作成されていない場合は、サイトがダウンしていると通知されるため、サイトは検証できません。


robots.txtファイルにはユーザー定義のクロールルールのセットが含まれているため、これを削除することは最初のクロール対象ファイルであるため解決策ではありません。最善の解決策は、ルールを修正し、robots.txtファイルをテストしてrobot.txtにサイトマップディレクティブを追加し、lastmodでサイトマップを最新の状態に保ち、頻度属性を変更することです。
Deepak Mathur
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.