Googleウェブマスターツールが、私のウェブサイトでブロックされた多くのリソースを報告していることに気づきました。現在、すべての「ブロックされたリソース」は、Cloudfront CDNから提供する.css、.jsおよび画像(.jpg、.png)です。
私は多くの時間をかけてテストし、Googleがこれらのファイルをクロールせず、「リソースブロック」ステータスを報告しない理由を理解しようとしました。
現在、これらのファイルをcdn1.example.com、cdn2.example.comなどのいくつかのホスト名から提供しています。
cdn1、cdn2などは、cloudfrontディストリビューション名に対するCNAMEです。
テスト:cloudfrontディストリビューション(CNAMEなし)を直接使用しようとしましたが、問題は解決しません。
現在、robots.txtは次のようになっています。
# Google AdSense
User-agent: Mediapartners-Google
Disallow:
#Google images
User-agent: Googlebot-Image
Disallow: /
User-agent: *
Disallow: /homepage
Disallow: /index.php*
Disallow: /uncategorized*
Disallow: /tag/*
Disallow: *feed
Disallow: */page/*
Disallow: *author*
Disallow: *archive*
Disallow: */category*
Disallow: *tag=*
Disallow: /test*
Allow: /
また、1つのサンプルページでブロックされたファイルの例:
cdn1.example.com/wp-content/plugins/wp-forecast/wp-forecast-default.css
cdn9.example.com/wp-content/plugins/bwp-minify/min/?f=wp-content/themes/magazine/css/font-awesome.min.css,wp-content/themes/magazine/css/sensitive .css
cdn5.example.com/wp-content/themes/magazine/images/nobg.png
cdn6.example.com/wp-content/plugins/floating-social-bar/images/fsb-sprite.png
cdn5.example.com/wp-content/uploads/2013/11/Design-Hotel-3-80x80.jpg
cdn5.example.com/wp-content/uploads/2013/11/Marta-Hotel-7-270x225.jpg
robots.txtのすべてを許可することも試みましたが、常に同じ結果が得られます。
また、AmazonのCloudFront設定を注意深く見ていましたが、関連する可能性のあるものは何もありませんでした(オプションを使用していないため、「ビューアアクセスを制限する(署名付きURLまたは署名済みCookieを使用)」を使用していません)。
現在、私はこれを調査するのに多くの時間を費やしており、これ以上のアイデアはありません。
GooglebotがAmazon CloudFrontでホストされているファイルのクロールをブロックされる理由を誰かが考えることができますか?
*
、URLの最後に「プレフィックス」を付ける必要はありません。/test*
と同じ/test
です。