GoogleはメンテナンスモードでDrupalサイトをクロールしますか?


10

私はAegirを使用して、test.mydomain.comというサブドメイン名でサイトのコピーを複製しています。これらのコピーは、スパマーや詮索好きな目を遠ざけるためにメンテナンスモードになっています。次に、これらのコピーを使用して、メインサイトmydomain.comへの変更をコミットする前に、テストと開発作業を実行します。

しかし、私はこれらのクローンされたサイトの存在によって私のSEOを傷つけていますか?メンテナンスモードになっているサイトをGoogleがクロールしますか?非常に多くの行き止まりのサブドメインがあると、ペナルティーが発生しますか?


3
この質問は、Googleの内部アルゴリズムに関するものであり、特にDrupalに関連するものではなく、有意なレベルの信頼で知っている可能性があるものであるため、トピックから外れているようです。
Mołot

7
@Mołotどうしてこれが話題にならないの?保守モードはDrupalの機能です。このシナリオを適切に処理する方法があります。Drupalが正しいことを行うかどうかを尋ねることは、将来の読者に役立ちます。
mpdonadio

2
@MPDの少なくとも一部は、「非常に多くの行き止まりのサブドメインがあることで私に不利益をもたらすか」は、完全にDrupalとは無関係です。そもそもGoogleがメンテナンスモードのページに移動する方法は、Drupalとは無関係です。
Mołot

回答:


21

Drupalサイトをメンテナンスモードにすると、非管理者には標準のメンテナンスモードのページが表示されます(そうするとキャッシュがクリアされたと想定)。応答を調べると、RFC 2616にある503のHTTPステータスコードで応答が返されていることがわかります。

503 Service Unavailable
現在、サーバーの一時的な過負荷またはメンテナンスのため、サーバーは要求を処理できません。これは、これが一時的な状態であり、少し遅れて緩和されることを意味しています。既知の場合、遅延の長さはRetry-Afterヘッダーに示される場合があります。Retry-Afterが指定されていない場合、クライアントは500応答の場合と同様に応答を処理する必要があります(SHOULD)。

そして、公式Googleウェブマスターブログから

サイトがメンテナンスのため停止している場合、Googlebotに「メンテナンスのための停止」ページにインデックスを付けるのではなく、後で戻るように指示するにはどうすればよいですか?
200(成功)ではなく503(ネットワーク使用不可)のステータスを返すようにサーバーを構成する必要があります。これにより、Googlebotは後でページをもう一度試すことができます。

したがって、Drupalが正しいことを行い、次にGoogleが5XX以外のステータスコードを取得したときに、サイトとインデックスページに再度アクセスするという証拠が得られます。


2
ユーザーログインページは引き続き200 OKステータスコードを返します(また、通常メンテナンスモードでは表示されないブロックなども表示します(#722434))。ただし、robots.txtにはログインページ用のDisallow:ディレクティブがあるため、正常に動作するボットはそれをインデックスに登録しません。
Garrett Albright 2013年

これは、メンテナンスページ自体の良い点です。503応答コードは、Googleがそのメンテナンスページをインデックスに登録しないことを意味します。
David Thomas

6

それを許可するために何か特別なことをしない限り、Googleはメンテナンスモードでサイトをクロールできません。

表示するにはログインする必要があるため、googlebotには指定されたメンテナンスページが表示されます。

Googleからの追加のガイドラインについては、次のリンクを参照してください。


ポイントは、Googleにメンテナンスページをインデックス登録させたくないということでした。
Fuzzy76 2016

2

あなたの懸念:

メンテナンスモードが「ブロックしたいすべてのもの」を100%(!)でブロックしているかどうかわからない場合でも、「googleのようなユーザーがまだアクセスできるかどうか」が非常に心配です。...メンテナンスモードは、最初の場所で開発サイトをブロックするための悪い選択かもしれません。

勧告:

個人的には、単に.htpasswd開発サイトに追加することをお勧めします。

aegirデプロイメント内でも自動化は簡単です。ブラウザーとすべてのコマンドラインツールがスキップできるので、邪魔になることはありません。あなたは他の人を入れることができます。それはグーグルなどに完全に100%サイトをブロックします。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.