投稿または記事の公開日が<lastmod>
XMLサイトマップ(他の人が示唆しているように)のエントリまたはその問題のLast-Modified HTTPヘッダーに基づいていることは非常に疑わしいです。XMLサイトマップは単なる助言であり、信頼できるものではありません。文書の最終変更日は、おそらく記事の(元の)発行日と同じではありません。また、ページ上部のコメントで述べたように、ドキュメントの最終変更日は、キャッシュおよびおそらくクロールレートの決定にとっておそらく重要です。動的に生成されたページのLast-Modified HTTPヘッダーは、多くの場合、実際の日付/時刻に非常に近い(WordPressブログの場合と同様)。
一方、RSS / Atomフィードには、この特定のナゲットの情報が含まれています。実際、コンテンツに公開日が含まれていないWordpressサイトでは、公開日が引き続きGoogleの検索結果に表示されます。そして、私が知る限り、これはRSSフィードの日付と一致します。
編集#1:ただし、RSSフィードには必ずしもすべてのページが含まれているわけではありません。ほとんどの場合、最新または最新の更新ページのみを含める必要があります。しかし、Googleがすでに読んだ内容をGoogleが忘れてはならない理由はありません。そのページのコンテンツが変更されていなければ、最終更新日も変更されません。
RSSフィードがない場合、Googleはページコンテンツを分析するのに十分賢いと思います。特に、日付がmicroformatsを使用して「意味的に」マークアップされている場合。Googleに含まれる記事の正式な発行日として、Googleが以下を確認することは完全に実現可能です。
<abbr class="published" title="2010-08-27T15:45:00-0700">
Friday, August 27th, 2010
</abbr>
Googleは確かにマイクロフォーマット(hCard、hReviewなど)を読み取ります。
付け加えると、Googleがこれを示唆する権威のあるものを見つけることができなければ、Googleが公開日を述べるとは思わない。不正な「公開日」はだれにも役に立たず、Googleはそのために多くの棒を取得するので、投機的なデータの「公開日」を推測するつもりはありません!
そして記録のためだけに(@Tomがそうでないことを示唆している場合:)、投稿/記事には公開日を目に見える形で表示すべきだと思います。多くの人はそうではなく、これは特に技術的な問題を調査するときに読者を苛立たせる可能性があり、記事の途中まで読んだことが古くなっていることがわかります!
編集#2: @mmdanzigerが彼の回答で詳しく述べているのと同じような不快感を経験しました。私の古いサイトの1つでは、すべてのページの上部に「Site Last Updated Sun 17th June 2012」という形式のテキスト(特別な方法でマークアップされていない)があります(JavaScriptでページに書き込まれます!!)。この同じ日付がGoogleによって選択され、SERPSに表示されるいくつかの(すべてではない)ページと一緒に表示されるようになりました-これは確かにページの公開日ではありません。Googleは単にページを「last updated(datestring)」(JavaScriptを処理した!!)という形式の文字列に置き換えているように思えます。この特定のサイトにはRSSフィードがありません。サイトにはSitemap.xmlファイルがありますが、日付は異なります。
他のサイトでも同様の動作に気づきました。