新しいGWTで「発見-現在インデックスが作成されていない」原因の可能性


18

新しいGWTは、新しいカテゴリに分割されたサイトマップリンクを表示します。私を混乱させる2つ:1.検出済み-現在インデックス化されていない2.クロール済み-現在インデックス化されていない

これには考えられる理由は何ですか?また、サイト全体に影響がありますか?これはGoogleからのサインですか?これらを削除することを検討する必要がありますか?

ここに画像の説明を入力してください

回答:


11

これはプロセスの一部です。実際にエラーが発生するまで、あなたがすることは何もありません

カテゴリを理解するには、インデックス作成がどのように機能するかを理解する必要があります。これは、ほぼ継続的に行われます。

  • Googlebotは、コンテンツをGoogleサーバーにダウンロードすることを意味するページを取得します。これが発生すると、ページがクロールされます。
  • その後、ダウンロードしたページのコンテンツをインデックスに入れます。これは、ページが索引付けされていることを意味します
  • ページをクロールしている間、ページを探してキューに入れます。それらのリンクは発見されます。

そう:

  • インデックスに登録されていないことを検出すると、Googlebotが最終的にクロールする可能性のあるもののキューにリンクが追加されたことを意味します。ウェブは事実上無限であり、優先順位付けがあるため、実際にそこに到達することはありません。
  • 現在インデックスに登録されていないクロールは、ページがGoogleサーバーにダウンロードされたが、そのコンテンツがインデックスに挿入されていないことを意味します。

1
GoogleがPageRankに基づいてクロール対象を決定すると付け加えます。より頻繁に、またはより顕著に(内部的にも)ページにリンクすると、Googlebotがクロールする可能性があります。
スティーブンオステルミラー

3
「現在インデックスが作成されていない」ということは、Googleがインデックスを作成しないことを選択していることも意味すると思います。重複しているか、低品質に見える可能性があります。Pagerankが不足している可能性があります。Googleは十分な検索と一致しないと考えるかもしれません。
スティーブンオステルミラー

これは私がとを示唆したものである優先順位付け。これは、重複が疑われるリンクで発生します(パラメータのみが異なるか、別の標準と一致するため)。
イタイ

私からの注意なしに、「現在クロールされていないインデックス登録済み」のページがドロップインおよびドロップアウトします。情報も疑わしい。例:検査されたURLは、インデックスが付けられているが、サイトマップにはないというメッセージになります...ページはサイトマップにあり、何年も使用されています。最近のアルゴリズムの更新により、このレポートはどんどん送信されました。
GLCoder

3

Googleはページを検出してクロールする場合がありますが、必ずしもそれらをインデックスに登録するという意味ではありません。

Googleがページをインデックスに登録しない理由はたくさんあります。おそらく、重複したコンテンツが見つかりました。おそらく、特定の検索クエリに対して十分な価値があるとは感じないでしょう。Googleはあなたのページについて、気に入らないものを見つけた可能性があります。

理由が何であれ、Googleはサイトで検出およびクロールしたページの一部をインデックスに登録することを決定していません。一部のページがインデックスに登録されないのはごく普通のことです。私のサイトのページのいくつかは、多くのインデックス付きページよりも優れたコンテンツを持ち、かなりの量の内部リンクを持っているにもかかわらず、インデックスが作成されません。Googleのインデックスシステムは、機械学習アルゴリズムです。したがって、未知のさまざまな理由により、一部のページをインデックスに登録しないこともあります。


1
「おそらく重複したコンテンツが見つかりました」>それを追加したいのですが、この場合、メッセージは「Discovered-現在インデックスが作成されていません」であるため、ページが取得されていないことを示します(または「Crawled」 -現在インデックスが作成されていません」)。したがって、この時点では、彼らはその内容について何も知りません。したがって、この段階での優先順位付けは、URL自体、それにリンクしているページ数、およびその他の可能性に依存していると思います。
ニーヴリス

2

Googlebotには、さまざまなパラメーターに基づいて独自のキューがあります。これは、それらのURLがキューに入れられていることに関するメッセージです。

ここに画像の説明を入力してください

Aj Cohnは、このメッセージの意味について一種の面白い意見を持っています。

発見済み-現在、インデックスに登録されていないのは、サイトマップで表示されていることを示しているようですが、他のコンテンツの外観に基づいて、クロールすることすらしていません。基本的に、「ややい!」または、それは単にクロールの効率が悪いことを表しています。

率直に言って、このステータスのサンプルURLの多くには最終クロール日があるため、Discoveredの定義が正確であるかどうかは完全にはわかりません。これは、提供されている定義と矛盾しているようです。


2
「マニュアルを読む」ビットを削除しました。それは役に立たない。特にGoogleのドキュメントはかなり貧弱です。
スティーブンオステルミラー

0

GoogleはURLを発見しましたが、クロールに時間を費やすほど重要だとは感じていませんでした。このページがオーガニック検索トラフィックを受信するようにしたい場合は、あなた自身のウェブサイト内からもっとリンクすることを検討してください。外部Webサイトからバックリンクを獲得できることを期待して、このコンテンツを他の人に宣伝してください。コンテンツへの外部リンクは、ページが価値があり、信頼できると見なされることを示すGoogleへのシグナルであり、インデックスに登録される可能性が高くなります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.