Googleは投稿の公開日をどのように認識しますか


17

Googleで何かを検索すると、その下に投稿/記事の公開日が表示されることがあります。また、Wordpressを使用したサイトで自分の記事を検索しましたが、Googleはその発行日も認識しています。

ウェブサイトのソースを開いても、特別なタグや公開日を示すものは表示されません。それは通常のdivでのみ書かれており、SEにそれが発行日であることを伝える特別なタグは付けられていません(ページの他の日付もあります)。

DOMツリーのWordpressの公開日の正確な場所をGoogleにハードコーディングしていますか、それとも何かが足りませんか?

私は自分のCMSを使用して新しいWebサイトを構築しています。日付公開された認識を実装する方法を探しています。


2
あなたは確かに何かを見逃している:あなたはHTMLを見ただけであるが、ページが変更されたときに言うHTTPヘッダーもあります。彼らはあなたの記事のパーマリンクについて何を報告していますか?Googleはそれを、ページがどれだけ変化したかという独自の記録と組み合わせて使用​​していると思いますが、実際の証拠はないため、回答ではなくコメントです。
ピーターテイラー

はい、鉱山は「ラフ」私も示唆した他の人のような非HTML要素/ヘッダーやサイトマップに見ることになります。..てみた
缶Poyrazoğlu

@Peter HTTPヘッダー(特にLast-Modifiedヘッダー)は、SEが使用するメトリックであることは間違いありません。ただし、少なくともGoogleが公開日として表示するものではなく、記事の「公開日」を決定する際に重要な役割を果たすとは思いません。(他のSEは「公開日」を表示しないようです)記事の公開日は、おそらく文書の最終変更日ではありません。動的なサイトのほとんどのページは(ワードプレスの投稿であっても)現在の日付/時刻に近いように見えます。IMO Last-Modifiedヘッダーは主にキャッシュに使用されます。
-MrWhite

私はそれは、サイトマップとは何か...持っていると思う
缶Poyrazoğlu

HTTPが最後に変更されたstackoverflow.com/questions/204010/…またはいくつかの準標準HTMLメタデータ:stackoverflow.com/questions/4575967 / ...は別の可能性ですが、Googleが本当にそれらを使用しているかどうかはわかりません。
Ciro Santilli新疆改造中心法轮功六四事件

回答:


4

xmlサイトマップまたはRSSフィードバージョンを使用して、Google、Yahoo、MSNなどの主要な検索エンジンを通じて公開データのインデックスを作成する必要があります。WebサイトのXMLサイトマップを生成し、インデックス用のWebマスターツールで送信します。


7

Google は、ページがその長い間インデックス化されており、月ごとに大幅に変更されているため、それが真実ではないことを知っているにもかかわらず、すべてのメインページが4年以上前に更新されていると表示されるという問題がありました。本当に困惑して、本当にイライラして、再び困惑した後、私はついに問題を見つけました。私たちの法的条件は、「最終更新日:2007年10月30日」の隠されたdivで提供され、divはほとんどすべてのページに読み込まれていました。(登録時にポップアップ表示されるため)私はそれを削除しましたが、今では日付が消えるか、より合理的なものに修正されると思います。

技術的な詳細や独自のインデックス作成履歴よりもサイトのセマンティクスを確認しているという警告ともう1つの証拠。


ページの最終変更日は、ページ、RSSフィード、またはXMLサイトマップのどこかに含まれていますか?
-MrWhite

私はそうしません。なぜなら、このサイトはニュースサイトではなく、それを強調したくないからです。理想的には、私のホームページの日付はありません。また、彼らはおそらく塩の大きな粒でlastmodを服用していることを想像しています-私が彼らだったら私は知っています。
mmdanziger

7

投稿または記事の公開日が<lastmod>XMLサイトマップ(他の人が示唆しているように)のエントリまたはその問題のLast-Modified HTTPヘッダーに基づいていることは非常に疑わしいです。XMLサイトマップは単なる助言であり、信頼できるものではありません。文書の最終変更日は、おそらく記事の(元の)発行日と同じではありません。また、ページ上部のコメントで述べたように、ドキュメントの最終変更日は、キャッシュおよびおそらくクロールレートの決定にとっておそらく重要です。動的に生成されたページのLast-Modified HTTPヘッダーは、多くの場合、実際の日付/時刻に非常に近い(WordPressブログの場合と同様)。

一方、RSS / Atomフィードには、この特定のナゲットの情報が含まれています。実際、コンテンツに公開日が含まれていないWordpressサイトでは、公開日が引き続きGoogleの検索結果に表示されます。そして、私が知る限り、これはRSSフィードの日付と一致します。

編集#1:ただし、RSSフィードには必ずしもすべてのページが含まれているわけではありません。ほとんどの場合、最新または最新の更新ページのみを含める必要があります。しかし、Googleがすでに読んだ内容をGoogleが忘れてはならない理由はありません。そのページのコンテンツが変更されていなければ、最終更新日も変更されません。

RSSフィードがない場合、Googleはページコンテンツを分析するのに十分賢いと思います。特に、日付がmicroformatsを使用して「意味的に」マークアップされている場合。Googleに含まれる記事の正式な発行日として、Googleが以下を確認することは完全に実現可能です。

<abbr class="published" title="2010-08-27T15:45:00-0700">
Friday, August 27th, 2010
</abbr>

Googleは確かにマイクロフォーマット(hCard、hReviewなど)を読み取ります

付け加えると、Googleがこれを示唆する権威のあるものを見つけることができなければ、Googleが公開日を述べるとは思わない。不正な「公開日」はだれにも役に立たず、Googleはそのために多くの棒を取得するので、投機的なデータの「公開日」を推測するつもりはありません!

そして記録のためだけに(@Tomがそうでないことを示唆している場合:)、投稿/記事には公開日を目に見える形で表示すべきだと思います。多くの人はそうではなく、これは特に技術的な問題を調査するときに読者を苛立たせる可能性があり、記事の途中まで読んだことが古くなっていることがわかります!

編集#2: @mmdanzigerが彼の回答で詳しく述べているのと同じような不快感を経験しました。私の古いサイトの1つでは、すべてのページの上部に「Site Last Updated Sun 17th June 2012」という形式のテキスト(特別な方法でマークアップされていない)があります(JavaScriptでページに書き込まれます!!)。この同じ日付がGoogleによって選択され、SERPSに表示されるいくつかの(すべてではない)ページと一緒に表示されるようになりました-これは確かにページの公開日ではありません。Googleは単にページを「last updated(datestring)」(JavaScriptを処理した!!)という形式の文字列に置き換えているように思えます。この特定のサイトにはRSSフィードがありません。サイトにはSitemap.xmlファイルがありますが、日付は異なります。

他のサイトでも同様の動作に気づきました。


これから正しい日付をどのように認識しますか?<div class="footer"> <div class="links"> April 24, 2011 | <a href=...これは、私の投稿の公開日を参照する
唯一の

それに続くアンカーに具体的なものはありますか?再び、そうではないかもしれません。RSSフィードもありますか(ドキュメントのMETAタグでリンクされています)?
MrWhite

「Googleはどのように日付を決定するのですか?」という答えを探していました。しかし、同じことに気づきました!Googleは、ヘッダーlast-modifiedまたはSitemap.xml <lastmod>ではなく、ページ自体で時間の文字列を見つけようとします。私の考えを確認してくれてありがとう!
evilReiko 14

5

GoogleはサイトマップとRSSフィードを使用して公開日を認識していると思います。標準に従ってxmlサイトマップを作成することで、CMSにこの機能を実装できます。

<lastmod>2011-08-18</lastmod>

2

GoogleのJonh Mueller氏によると:

さまざまな信号を使用して、表示する日付を決定します。または、日付をまったく表示することに意味があるかどうかを判断します。1つの特定の属性に関連付けられていません。

ジョン・ミューラー-Twitter

ただし、Googleは次の場所でWebページの日付を検索する可能性が最も高いと思います。

  • 機械学習を使用して、ページ上でわかりやすく表示
  • Schema.org構造化データ。特に、データがページ上でわかりやすい場所にある場合

1

私はそれがページ上の日付を賢く探し、それがそれを使用する関連日付であると確信するときを考える。

SERPのクリック可能性にマイナスの影響を与える可能性があると思うので、少し難しい場合があります。最近の記事/投稿であれば、一時的にプラスの影響を与える可能性があると思いますが、 (ただし、Googleの検索者は、これがないと良いとは限りません!)

Googleで制御するオプションはなく、独自の方法でのみ制御できます。次のいずれかを実行できます。

  • 日付を動的に生成された画像に置き換えて、Googleによる検出を停止しようとしますが、これにより、視覚的な配置/一貫したフォント表示/アクセシビリティなどの他の問題が発生する可能性があります。
  • すべての日付をページから削除します(関連情報がある場合、訪問者/ユーザーがソースの年齢を知りたい場合、これもまたイライラするかもしれません)。

これらの理由から、私はそれを無視します。


日付を削除しようとはしていません:)作成中の新しいサイトに日付機能を追加しようとしています。
Poyrazoğlu11年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.