回答:
サブドメインのウェブサイトのディレクトリのルートに、robots.txtというファイルを追加します。
User-agent: *
Disallow: /
これにより、Webクローラーはサイトをインデックスに登録しないように指示されます。彼らは従う必要はありませんが、主なものは従います。
noindex
サブドメインのインデックスやその他のページにも追加する必要があります
サブドメインでrobots.txtファイルを使用すると役立ちます(Googleはこれに従います)が、別の手順として、このサブドメインをインデックスに登録しないようにGoogleウェブマスターアカウントで指定できます。サブドメインのすべてのページでメタタグを使用することもできます。
<meta name="robots" content="noindex">
これがたまたま内部テストにのみ使用しているサイトである場合、仮想ホストファイルで特定のIPアドレスのセットに可視性を制限すると、サイトがさらに非表示になります。
meta
すべてのページにnoindex タグを埋め込む代わりにX-Robots-Tag
、指定したサブドメインのサーバーからHTTP応答ヘッダーを返すことができます-これは一度だけ実行する必要があります。
...現在SEOの結果に表示されていますか?
他の答えは、検索結果からページを積極的に削除するのではなく、主に(サブ)ドメイン(主に質問の対象です)のインデックス作成を防止することです。あなたの他の質問。
他の回答に記載されているように、robots.txtでサイトをブロックし、noindex meta
タグ(またはX-Robots-Tag
HTTP応答ヘッダー)を提供する必要がありますが、ページへのアクセスをブロックし、404または410ステータスコードを返す必要もあります。
詳細については、Googleウェブマスターツールのヘルプページをご覧ください。
コンテンツを削除するための要件
これらすべての準備が整ったら、GoogleウェブマスターツールのURLの削除ツールを使用できます。ただし、これはサイト全体ではなく、個々のURLにのみ適用されますが、それは出発点です。(Googleは、robots.txt、noindex、404の提供がGWT削除ツールを使用するための要件であると述べています。)
ただし、通常のユーザーがURLを入力してサイトにアクセスできるようにしたい場合は、コンテンツが利用できなくなるため、問題になります。Zistoloenが示唆するように、パスワードを設定できますが、デフォルトでは403(禁止)が返され、404/410を返すにはオーバーライドする必要があります。あなたは可能性がマントにGooglebotに410を返すと、誰もが入力できるように、あなたのコンテンツを-しかし、どのような人々がのSERPsで結果をクリックしてはどうですか?
ただし、Googleにできるだけ早くコンテンツを削除してもらいたい場合は、「Google」インターネットからコンテンツを削除する必要があります。