データが毎日更新されていない場合、Googleはサイトマップで毎日更新される<lastmod>タグにペナルティを課しますか?


10

製品ページへの多くのリンクを含むサイトマップを毎日生成しています。これらの製品は、別のデータソースから毎日インポートされます。更新はすべての現在の製品情報を破棄し、それを新しいインポートされた情報で置き換えることからなるため、最終変更日は常に1日ジャンプします。これはサイトマップでも使用されます。変わっていない商品でも。すべての製品ページが更新されたように見せかけています。

Googleは、ページが変更されていない間に、ページが変更されたように見せかけたウェブサイトにペナルティを課しますか?

私の解決策は、新しくインポートされた製品データが以前のデータと異なる場合にのみエントリを変更することです。これが有用なアップグレードであることを確認したいだけですが、他の改善にも時間を費やすことができます。

回答:


5

このため、ペナルティについて何も聞いたことがありません。最悪の場合、クモの時間を浪費しますが、それが私たちがそもそもコンピューターを持っている理由の1つです。それでも、理想的には問題に対処する必要があります。

この...

私の解決策は、新しくインポートされた製品データが以前のデータと異なる場合にのみエントリを変更することです。

...サイトマップなどの外部の考慮事項に関係なく、最初に行うべきことです。コンテンツが変わらない場合(そして、その説明で削除して、同じ情報で置き換えることも含めます)、lastmod日付は変更しないでください。ここでは、自分のリソースを無駄にしています。関与する製品の数についてはまだ説明していませんが、このプロセスが遅くなり、計算コストが高くなる可能性があります。


全くもって同じ意見です。しかし、私はデータを提供する別の会社に依存しています。彼らは常にデータのエクスポートですべての製品(+200)を送信します。したがって、ロットを更新することは、数年前には最良の解決策であると思われました。私のクライアントはこれを適切に解決する予算がありません。これらのex /インポートは夜間に行われるため、現時点で余分に使用されるリソースは大きな問題ではありません。
12

@Elicitこの問題が引き続き発生する場合は、前日のデータエクスポートを元の解析可能な形式で保存し、git diffスタイルの比較を行って、変更された製品を確認します。すばらしいのですが、変更された製品のみを送付する必要はありません。あなたはそれを自分で理解できるはずです。
匿名のペンギン

3

私は<lastmod>毎日更新するという考えが好きではありません。間違っているだけでなく、誤解を招く検索エンジンです。

SOのオーバーポスト、GoogleのゲイリーIllyesは書きました:

lastmodタグはシットマップではオプションであり、ほとんどの場合、検索エンジンでは無視されます。これは、ウェブマスターが恐ろしい仕事をして正確に維持しているためです。

私は通常<lastmod>、正しく使用するか、まったく使用しないかのどちらかを提唱しています。(<changefreq>&と同様に<priority>)オフのままにすると、ファイル自体が小さくなり、検索エンジンが読み取るのも速くなります。


2

いいえ。Googleはlastmodヒント(すべてのサイトマップ値と同じ)を使用しますが、コンテンツが毎日更新されていないと判断した場合は、それを単に無視し、独自のスケジュールでページに再アクセスします。


2

私はGoogleでは働いていません。実際に何をしているのかはっきりとは言えませんが、タイムスタンプを処理する賢明な方法は、変更され<lastmod>いないページを再クロールする時間を無駄にしないためのヒントとなるでしょう。

したがって、すべてのページが毎日変更されていると報告した場合、Googlebotは、変更されたページだけに集中するのではなく、すべてのページを思いどおりの順序でクロールし続けるだけです。実際には、最終更新のタイムスタンプをまったく報告しなかったかのようです。

正しい<lastmod>タイムスタンプを提供する主な理由は、サイトの変更をGoogleのインデックスにすばやく表示させるためです。サイトに数百のページがある場合、Googleがすべてのページをクロールして変更を見つけるまでにはしばらく時間がかかります。ただし、最近変更されたページをGooglebotに通知すると、それらのページが最初にクロールされ、残りの時間を無駄にすることがなくなります。

もちろん、代わりにウェブマスターツールでGooglebotのクロール速度を上げて、最高のものを期待することもできます。しかし、実際には、更新スクリプトでタイムスタンプを保持することはそれほど難しくありません。たとえば、私はあなたが現在次のようなことをしていると仮定します:

for each product do:
    write new page content into product page file;
end do;

その場合は、代わりに次のように変更してください。

for each product do:
    read old page content from product page file into string A;
    write new page content into string B;
    if A is not equal to B then:
        write string B into product page file;
    end if;
end do;


1

Googleがこれを罰することはありません。ペナルティを取得するには、Googleのお尻を真っ黒にする必要があるので、心配しないでください。Googleは、コンテンツに変更があった場合(それが過去数年間に取り組んできた内容です)、lastmodプロパティをヒントとして使用するかどうかをすぐに判断します。


1

XMLサイトマップとRSS / Atomフィードのベストプラクティスを読むことをお勧めします

最終変更時刻

XMLサイトマップとRSS / Atomフィードの各URLの最終変更時間を指定します。最終変更時刻は、ページのコンテンツが有意に変更された最後の時刻でなければなりません。変更が検索結果に表示されることを意図している場合、最終変更時刻はこの変更の時刻である必要があります。

XML sitemap uses  <lastmod>
RSS uses <pubDate>
Atom uses <updated>

最終変更時刻を正しく設定または更新してください。

Specify the time in the correct format: W3C Datetime for XML sitemaps, RFC3339 for Atom and RFC822 for RSS.
Only update modification time when the content changed meaningfully.
Don’t set the last modification time to the current time whenever the sitemap or feed is served.

アップデートありがとうございます。うまくいけば、反対投票者がそれを見て、反対票を投じるでしょう。
ジョンコンデ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.