私はGoogleでは働いていません。実際に何をしているのかはっきりとは言えませんが、タイムスタンプを処理する賢明な方法は、変更され<lastmod>
ていないページを再クロールする時間を無駄にしないためのヒントとなるでしょう。
したがって、すべてのページが毎日変更されていると報告した場合、Googlebotは、変更されたページだけに集中するのではなく、すべてのページを思いどおりの順序でクロールし続けるだけです。実際には、最終更新のタイムスタンプをまったく報告しなかったかのようです。
正しい<lastmod>
タイムスタンプを提供する主な理由は、サイトの変更をGoogleのインデックスにすばやく表示させるためです。サイトに数百のページがある場合、Googleがすべてのページをクロールして変更を見つけるまでにはしばらく時間がかかります。ただし、最近変更されたページをGooglebotに通知すると、それらのページが最初にクロールされ、残りの時間を無駄にすることがなくなります。
もちろん、代わりにウェブマスターツールでGooglebotのクロール速度を上げて、最高のものを期待することもできます。しかし、実際には、更新スクリプトでタイムスタンプを保持することはそれほど難しくありません。たとえば、私はあなたが現在次のようなことをしていると仮定します:
for each product do:
write new page content into product page file;
end do;
その場合は、代わりに次のように変更してください。
for each product do:
read old page content from product page file into string A;
write new page content into string B;
if A is not equal to B then:
write string B into product page file;
end if;
end do;