GoogleプレビューはRobots.txtに従いますか?


11

確かにそうですから。私のサイトでは、画像ディレクトリを許可していません。プレビューはすべて画像が欠落しているため、サイトが不安定に見えます。

これは事実ですか?プレビューボットだけがrobots.txtを使用して画像にアクセスできるようにする方法はありますか?

編集:プレビューは、通常のGoogleボットと、ウェブマスターセントラルブログで(簡単に)言及されているオンザフライボットのGoogle Webプレビューの両方によって生成されているようです。

サイトを使用することにより、ボットが私のサイトにヒットしたとき、およびこれが発生したときに、画像がプレビューに正常に表示されたことがわかりました。ですから、私の推測では、通常のクローラーはrobots.txtごとの画像を無視しますが、プレビュークローラーはとにかく画像を取得します。

私のオプションは次のように見えるので、この実装は一種の不器用に見えます:

  1. グーグルボットが私の画像をクロールすることを許可する(私はしたくない)
  2. プレビューをブロックするnosnippetタグを使用しますが、ALSOスニペット(私はしたくありません)
  3. クリックスルーに悪影響を与える可能性のある不安定なプレビューを表示させます

画像にインデックスを付けないだけの問題であれば、クロールを許可し、 "noindex"を付けたx-robots-tag HTTPヘッダーを使用して画像を提供できます。
John Mueller

@John Muellerこれが答えのようです。回答セクションに投稿してみませんか?
plntxt

回答:


3

ジョン・ミュラーはコメントでそれを正しかったと思う。

画像にインデックスを付けないだけの問題であれば、クロールを許可し、 "noindex"を指定したx-robots-tag HTTPヘッダーを使用して画像を提供できます。

Googleがインデックスを作成せずにコンテンツをクロールできるようにすることができることを知りませんでした。私は彼のテクニックを導入し、それが機能するかどうかを確認するためにクロールされるのを待っています。

ジョンが担当者を獲得できるように回答セクションにコメントを追加したくない場合を除いて、数日以内にこれを回答として受け入れます。


コメント-回答について申し訳ありません:)。覚えておくべきことの1つは、このプロセスは現時点ではそれほど高速ではないということです。画像のインデックス作成ステータスの変更は、通常、ウェブ検索よりも遅く、プレビュー画像の更新は、通常のウェブ検索コンテンツ(キャッシュページ、タイトル、スニペット)の更新よりもはるかに長くかかる場合があります。実際には、これが変更を確認するのに数週間かかると思います-辛抱してください:)
John Mueller

忍耐が鍵です。変更から数週間後、いくつかの画像が表示されていますが、まだ欠けています。しかし、これが私の問題の解決策だったようです。
plntxt

2

プレビューの大部分はGoogleボットクローラーによって行われるため、サイトの一部のクロールをブロックすると、プレビューに影響します...

Googleボットに画像のクロールを許可したくないのですか?


2
私たちは製品の写真にかなりの時間とお金を投資しています。画像検索を使用する人は通常画像を検索しており、製品を購入するつもりがないため、画像を画像検索から除外したいと考えています。私たちの画像がインデックスに登録されていれば、競合他社がそれらを盗みやすくなります。
plntxt、

1
あなたはあなたの写真に透かしを入れたり、ステガノグラフィーに著作権を
与え

1
@G。Qyyまたは、無制限の数のサルに支払い、著作権で保護された画像をWebでスキャンすることもできます。
plntxt 2010年

@ジム:または、あなたの写真を大切に紙に保存し、決してインターネットに掲載しないでください... ^^
Pascal Qyy

1
良い点-あなたの写真を完全に保護できるものは何もないが、私はそれらをGoogleのインデックスに登録したくない。私は透かしのファンではありません。他の場所で画像を削減する最も費用効果の高い方法は、画像をインデックスから除外することです。
plntxt '18

2

以下は、単にサイトに適用するだけの場合とそうでない場合がある技術的な解決策です。

Googleがメタデータまたはrobots.txtにほんの少しのヒントを使用してこれを実行する方法を発表する可能性がありますが(それも)、それまでは...


ステップ1。

フロントページイメージ用のリダイレクトサービス/サーブレットを作成します。

すなわちURLのような

/frontpageimages/[image name]

それはサーバー側にリダイレクトします

/images/[image name]

ステップ2。

画像に直接リンクするのではなく、ステップ1からリダイレクトサービスを経由するように、フロントページ(およびフロントページのみ)のすべての画像リンクを書き換えます。

ステップ3。

robots.txtがgooglebotのクロールを許可していることを確認してください /frontpageimages/


これにより、Googleが他のページにある画像をそのままにして、フロントページにあるすべての画像をクロールできるようになります。

リダイレクトサービスは、理論にはrobots.txtに技術的に違反せずにすべての画像をクロールするために使用できますが、(googlebotなどの)正常に動作するロボットが行うことではありません。また、動作不良のロボットはrobots.txtを心配する必要はありません。


トップページにプレビューのみを表示したい人はいますか?すべてのページに適切なプレビューを表示したいのですが。すべてのページでこれを行うと、最初に画像をブロックする目的が本質的に無効になります。
John Conde

@ジョンあなたは正しいです。その場合は、Googleにインデックスを作成させるか、しないかを指定します。
クリス
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.