URLがGoogleによって最初にインデックス化された時期を確認するにはどうすればよいですか?


16

特定のURLがGoogleによって最初にインデックス化された時期を確認するにはどうすればよいですか?私が所有していない競合他社のURLでも機能するソリューションを希望します。


1
答えが「いいえ」である可能性は十分にあります。Googleはこの情報を保存することさえできません(特別な理由がないため)、または保存しても、第三者に公開することはできません。
イルマリカロネン14

1
他の人が言及したように、この情報を取得することはできません。サーバーログにアクセスできる場合、最初にクロールされた日時を確認できますが、それでもその時点でインデックスが作成されたわけではありません。
ジョンミューラー14

回答:


15

URLの年齢を知るには、このリンクをたどって目的のURLに置き換えwww.example.comます。

https://www.google.com/search?tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2000&q=site%3Ahttp%3A%2F%2Fwww.example.com&safe=active&gws_rd=ssl

たとえば、スタックオーバーフローのメタサイトに対するGoogleの結果は次のとおりです。 ここに画像の説明を入力してください

それ以外の場合、Waybackマシンも優れたソリューションですが、私の経験からすると精度が低くなります。


3
Googleのその機能は英語でも利用できますか?フランス語版にリンクしました。
スティーブンオステルミラー

1
@StephenOstermiller tldをから.frに変更するだけ.comです。
MDMoore313 14

2
@Zistoloenはあなたの答えを+1しますが、あなたの質問には疑問があります。あなたが言ったように、私はあなたのサンプルクエリを使用してwww.stackexchange.com検索しましたが、結果を表示していません。wwwこの時点でも削除して検索しましたDec 1, 2014が、URLの年齢になり得ないごく最近の日付の結果が表示されています。間違って検索していますか?何か足りない?
サティヤクマール14

2
私はこの答えを「盗み」、より良い説明で答えに追加しました。これは素晴らしいトリックです、Zistoloen。
スティーブンオステルミラー

6
@Stephen&Zistoloen:これは一般的に、ページがGoogleによって最初にインデックス化された日付ではありません。いくつかのテストに基づいて、このメソッドで表示される日付は、ページのコンテンツから取得されたようです(Googleが「発行日」または「最終変更日」のように見えるものを見つけた場合)、またはそうでない場合Googleが最後に(実質的な?)ページの変更を検出した日付に基づいて、コンテンツに日付が見つかります。もちろん、最初の発行後にページが変更されなかった場合、これその発行日と同じになることがありますが、それを保証するものではありません。
イルマリカロネン14

8

Zistoloenは、ページのコンテンツを最初にインデックスに登録した日付をGoogleに表示する方法を見つけました。私はそれをより明確に説明できると思うので、私もそれを答えに加えています。

  1. Googleで検索して、結果として目的のページを表示するものを探します
  2. 「検索ツール」を使用する
  3. 「いつでも」ドロップダウンから「カスタム範囲...」を選択します
  4. 1/1/1900から1/1/2020などの大きな日付範囲を入力します

その後、Googleは検索結果のページにあるコンテンツを発見した日付を表示します。

最初のインデックス

ページが新しいコンテンツで更新されると、Googleもこの日付を更新します。したがって、「このURLを最初にインデックス付けした」日付ではなく、「このコンテンツを最初にインデックス付けした」日付になります。


ページのGoogleキャッシュは、ページが最後にインデックス化された日時を示します。Stack Exchangeのホームページが本日最後にインデックス付けされたことがわかります。

ここに画像の説明を入力してください


別のオプションは、インターネットアーカイブのWaybackマシンを使用することです。これは、過去のページの外観を示しています。ページが最初に公開された時期を把握できます。Googleとインターネットアーカイブの両方が、最初に公開された直後にページをクロールして使用します。


1
最初のオプションでは、すべてのURLに対して正確な結果が得られますか?あなたが説明したようにbing.comを検索しましたが、の最初のインデックス日付は取得していませんbing.com。私が間違っていたらごめんなさい?
サティヤクマール14

1
ページのコンテンツが変更されていない限り、正確であるように見えます。ページがオーバーホールされると、Googleはこの日付をリセットする場合があります。 私のホームページは 2月1日と表示されているにもかかわらず、2002年には、内部のページは 2月1日、2001年と表示されているホームページが周りに再設計された内部ページは2001年以来、実質的に変更されていないのに対し、時間という
スティーブンOstermiller

@SathiyaKumar Bing.comは、この方法を使用して、2014年3月19日の日付を提供します。Googleによって(robots.txtなどを介して)インデックス化されていないものは、明らかにこの方法では表示されないことに注意してください。
Thebluefish 14

4

そこではないこと確かに私はこれを行うにどのような方法を知らない-任意のWebページが最初にGoogleでインデックス化されたときに見つけるためにどのような方法。Googleがその情報を保存しないのは、彼らが必要とする本当の理由がないためです。その上、たとえこの情報を保存したとしても、第三者が自由に利用できるようにする特別な理由はありません。

(自分のページで、古いWebサーバーのアクセスログにアクセスできる場合は、簡単です。Googlebotからそのページへの最初のアクセスのログを検索するだけです。そうでなければ、確実に伝える方法がないかもしれません。


いずれにせよ、ZistoloenとStephen Ostermillerの回答で説明されている方法では、通常、特定のURLがGoogleによって最初にインデックス付けされた日付は明らかになりませ。むしろ、URLのコンテンツが公開または最後に更新されたとGoogle 判断した日付を示します。多くの場合、ページコンテンツ自体から日付を「スニッフィング」するGoogleのある程度信頼できる試みに基づいています。

、このビデオ、Googleのマットカッツは、これらの日付が選択された方法で簡単に触れます。便宜上、ビデオの関連部分(約2:09から2:22)を書き起こしました。

「...多くの場合、日付を推測しているとき、または最初に見たとき、そのページをクロールしたとき、またはページのどこかでそれを見つけることができ、その日付を抽出できれば、スニペットの最初の部分で確認できます。」

ブログの投稿、Wikiページ、Stack Exchangeの質問など、ソフトウェア実行サイトがページ自体の正確な作成/変更日を自動的に報告するページの場合、Googleが報告する日付はそれと一致する可能性があります。ただし、他の種類のページの場合、Googleの日付スニファーは一生懸命働かなければならず、常に正しくなるとは限りません(この文脈では「正しい」とはどういう意味でもかまいません)。

特に、これらの日付は、ページがどのくらい前にインデックス化されたかを判断するのに基本的に役に立ちませんこれには 2つの理由があります

  • ページが最近変更され、変更日がページに目立つように表示されている場合、変更が完全に些細なものであっても、Googleはそれをページの「日付」として選択することがあります。

    たとえば、このかなり古いWikiページ2003年に archive.orgが最初にインデックス付けされた)は、現在、ページの下部に示されているように、2014年11月10日(最後に編集された日付)から日付がスタンプされます。その日に起こった変化は?ページの下部から1つのリンクを削除するだけです。

  • 逆に、Googleはページ上で非常に古い「発行日」を見つけた場合、World Wide Webの発売前に発行されたものであっても喜んで受け入れているようです。

    たとえば、古いプログラミングコンテストのこのページの日付は、Googleによって1986年9月15日です。実際には、ページに記載されているイベントの日付です。同様に、1970年の学生のストライキを文書化したこのページの日付はGoogleによって1970年 5月10日(ページ上のスキャンされた文書の1つの日付)であり、さらに不合理なことに、このLinuxマニュアルページの日付はGoogleによって11月4日です、1989(ページで使用されるランダムな日付の例)。

    StephenとZistoloenによって記述されたカスタムの日付範囲検索を使用して、このような例をさらに見つけることができますが、範囲の上限を、たとえば1991年8月6日に設定します。


あなたの答えでは、主にStephenとZistoloenの答えに反対しましたが、OPの質問「GoogleがURLを最初にインデックス付けしたときはどうすればわかりますか?」に対する適切な答えが見つかりません あなたの答えに!!
サティヤクマール14

そこではないこと、「あなたがすることはできません」または「誰もがどのように知っていない」ことを他のいずれかの答え。しかし、あなたは正しい、それを私の答えに編集させてください。
イルマリカロネン14

@llmariKaronen +1を編集して、OPの実際の質問に対する回答を追加します。
サティヤクマール14
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.