XMLサイトマップのゴミ(リンク切れ)が未満であることを確認する必要があります。URLのリストは数十万にのぼり、それらすべてを1つずつテストすることが可能であるとしても、多くの理由で、私はむしろそうではありません。
1 - Saved bandwidth
2 - Faster traffic for real clients
3 - Less noise in visitor statistics (because my test would count as a visit)
5 - I could go on...
ランダムなサブセットを取るだけで十分だと思います。問題は確率がわからないことです。
使えるシンプルな機能はありますか?
それが役立つ場合は、リンクが実行全体で壊れる可能性に関する事前情報があると仮定できます。実行全体で、特定のリンクが切断されるのにあるとしましょう。
URLはいくつありますか?(有限母集団についての推論は、無限母集団についての通常の推論の場合とは多少異なります。)
—
Kodiologist
?? 明らかに有限数
—
gurghet
言うまでもありませんが、有限数はどれですか。
—
コディオロジスト2017
10万人を超える毎日は少し異なります
—
gurghet
それを変えているあなたのサイトマップに何が起こっていますか?毎日完全に異なるサイトマップがありますか、それともいくつかのURLが追加および削除されますか?後者の場合、追加または削除されたものを追跡して、新しいものだけをチェックする必要がありますか?
—
コディオロジスト2017