すばらしい質問です。バイドゥのクモは悪名高く攻撃的であり、サーバーからリソースを奪う可能性があるため、多くのウェブマスターが興味を持っているかもしれません...
BaiduのWeb Searchニュースで示されているように、Baiduスパイダーはクロール遅延通知設定をサポートしていません。代わりに、サイトに記載されているように、Baidu Webmaster Toolsプラットフォームでサイトを登録および確認する必要があります。これは、Baiduで直接クロール頻度を制御する唯一のオプションのようです。
問題は、他のスパムボットは、(上場Baiduのユーザーエージェントを使用することで、ここで自分のよくある質問の中で示されているように、あなたのサイトをスパイダーする番号2の下を)ここで百度と遅くクロール速度を要求することは、すべてを解決しないかもしれないので4番下。
したがって、BaiduのWebmaster Toolsを使用することに決めた場合は、Bots vs Browsers Databaseなどのリソースを使用するか、逆DNSルックアップを使用して、ユーザーエージェントと関連付けられていることが知られているIPとを比較することも賢明かもしれません
他の唯一のオプションは、すべてのBaiduユーザーエージェントをブロックし、Baiduからの潜在的なトラフィックを犠牲にするか、Apacheのmod_qosなどを使用して過剰なリクエストを制限することです。
- ロケーション/リソース(URL)または仮想ホストへの同時リクエストの最大数。
- URLへの1秒あたりの最大許容リクエスト数や1秒あたりのダウンロードされたキロバイトの最大/最小などの帯域幅の制限。
- 1秒あたりのリクエストイベントの数を制限します(特別なリクエスト条件)。
- また、Webサーバーにアクセスする可能性のある非常に重要な人物(VIP)を制限なしで、または制限なしで「検出」できます。
- 不正な操作を拒否するための一般的な要求行とヘッダーフィルター。ボディデータの制限とフィルタリングを要求します(mod_parpが必要です)。
- TCP接続レベルの制限。たとえば、単一のIPソースアドレスまたは動的なキープアライブ制御から許可される接続の最大数。
- サーバーが空きTCP接続を使い果たした場合、既知のIPアドレスを優先します。
ロードが遅く、翻訳の問題がある(英語版でもない)Baidu Webmaster Toolsで報告された経験を見つけていません。それは役立つかもしれませんが、もちろん意見に基づいています。