特定のURLがGoogleによって最初にインデックス化された時期を確認するにはどうすればよいですか?私が所有していない競合他社のURLでも機能するソリューションを希望します。
特定のURLがGoogleによって最初にインデックス化された時期を確認するにはどうすればよいですか?私が所有していない競合他社のURLでも機能するソリューションを希望します。
回答:
URLの年齢を知るには、このリンクをたどって目的のURLに置き換えwww.example.com
ます。
https://www.google.com/search?tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2000&q=site%3Ahttp%3A%2F%2Fwww.example.com&safe=active&gws_rd=ssl
たとえば、スタックオーバーフローのメタサイトに対するGoogleの結果は次のとおりです。
それ以外の場合、Waybackマシンも優れたソリューションですが、私の経験からすると精度が低くなります。
.fr
に変更するだけ.com
です。
www
この時点でも削除して検索しましたDec 1, 2014
が、URLの年齢になり得ないごく最近の日付の結果が表示されています。間違って検索していますか?何か足りない?
Zistoloenは、ページのコンテンツを最初にインデックスに登録した日付をGoogleに表示する方法を見つけました。私はそれをより明確に説明できると思うので、私もそれを答えに加えています。
その後、Googleは検索結果のページにあるコンテンツを発見した日付を表示します。
ページが新しいコンテンツで更新されると、Googleもこの日付を更新します。したがって、「このURLを最初にインデックス付けした」日付ではなく、「このコンテンツを最初にインデックス付けした」日付になります。
ページのGoogleキャッシュは、ページが最後にインデックス化された日時を示します。Stack Exchangeのホームページが本日最後にインデックス付けされたことがわかります。
別のオプションは、インターネットアーカイブのWaybackマシンを使用することです。これは、過去のページの外観を示しています。ページが最初に公開された時期を把握できます。Googleとインターネットアーカイブの両方が、最初に公開された直後にページをクロールして使用します。
bing.com
。私が間違っていたらごめんなさい?
そこではないことも確かに私はこれを行うにどのような方法を知らない-任意のWebページが最初にGoogleでインデックス化されたときに見つけるためにどのような方法。Googleがその情報を保存しないのは、彼らが必要とする本当の理由がないためです。その上、たとえこの情報を保存したとしても、第三者が自由に利用できるようにする特別な理由はありません。
(自分のページで、古いWebサーバーのアクセスログにアクセスできる場合は、簡単です。Googlebotからそのページへの最初のアクセスのログを検索するだけです。そうでなければ、確実に伝える方法がないかもしれません。
いずれにせよ、ZistoloenとStephen Ostermillerの回答で説明されている方法では、通常、特定のURLがGoogleによって最初にインデックス付けされた日付は明らかになりません。むしろ、URLのコンテンツが公開または最後に更新されたとGoogle が判断した日付を示します。多くの場合、ページコンテンツ自体から日付を「スニッフィング」するGoogleのある程度信頼できる試みに基づいています。
で、このビデオ、Googleのマットカッツは、これらの日付が選択された方法で簡単に触れます。便宜上、ビデオの関連部分(約2:09から2:22)を書き起こしました。
「...多くの場合、日付を推測しているとき、または最初に見たとき、そのページをクロールしたとき、またはページのどこかでそれを見つけることができ、その日付を抽出できれば、スニペットの最初の部分で確認できます。」
ブログの投稿、Wikiページ、Stack Exchangeの質問など、ソフトウェア実行サイトがページ自体の正確な作成/変更日を自動的に報告するページの場合、Googleが報告する日付はそれと一致する可能性があります。ただし、他の種類のページの場合、Googleの日付スニファーは一生懸命働かなければならず、常に正しくなるとは限りません(この文脈では「正しい」とはどういう意味でもかまいません)。
特に、これらの日付は、ページがどのくらい前にインデックス化されたかを判断するのに基本的に役に立ちません。これには 2つの理由があります。
ページが最近変更され、変更日がページに目立つように表示されている場合、変更が完全に些細なものであっても、Googleはそれをページの「日付」として選択することがあります。
たとえば、このかなり古いWikiページ(2003年に archive.orgが最初にインデックス付けされた)は、現在、ページの下部に示されているように、2014年11月10日(最後に編集された日付)から日付がスタンプされます。その日に起こった変化は?ページの下部から1つのリンクを削除するだけです。
逆に、Googleはページ上で非常に古い「発行日」を見つけた場合、World Wide Webの発売前に発行されたものであっても、喜んで受け入れているようです。
たとえば、古いプログラミングコンテストのこのページの日付は、Googleによって1986年9月15日です。実際には、ページに記載されているイベントの日付です。同様に、1970年の学生のストライキを文書化したこのページの日付はGoogleによって1970年 5月10日(ページ上のスキャンされた文書の1つの日付)であり、さらに不合理なことに、このLinuxマニュアルページの日付はGoogleによって11月4日です、1989(ページで使用されるランダムな日付の例)。
StephenとZistoloenによって記述されたカスタムの日付範囲検索を使用して、このような例をさらに見つけることができますが、範囲の上限を、たとえば1991年8月6日に設定します。