Googleで見つけられないものは何ですか?[閉まっている]


18

Googleは公平であると主張しており、クモがアクセスできるあらゆるものをインターネットで探し回ることは(ほとんどの場合)会社の利益になります。私は知りたいです:

  • Googleはどのタイプの(一般にアクセス可能な)コンテンツを配信できませんか?
  • Googleが取得できない特定の種類のコンテンツはありますか?

特にGoogleのドキュメントへの参照は、特に素晴らしいでしょう。


EUが「忘れられる権利」を制定した今、私たちはもう見つけることができないでしょう。ここに「忘れられた」ものがあります。
samthebrand

回答:


21

物の種類に関するいくつかのアイデア:

  1. ドメインのrobots.txtファイルによって明示的に禁止されているコンテンツは、Googleインデックスから除外されます。
  2. Googleが既に知っている他のウェブサイトからリンクされていないウェブサイト。つまり、おそらく目に見えるページからリンクされないウェブサイトがたくさんあります。それらのウェブサイトは、ウェブマスターツールを介してGoogleに手動で送信されない限り、Googleスパイダーによって検出されることはありません。
  3. 記入する必要があるWebフォームの背後にあるWebサイト。
  4. 国勢調査の画像。コンテンツは多くの場合手動でインデックス付けされる画像であるため、通常はancestry.comなどの有料サイトで見つけられます。

ディープウェブの詳細


2
ポイント2それは真実ではありません。ウェブマスターツールからサイトをGoogleに送信すると、他のウェブサイトからリンクされていなくてもインデックスに登録されます。
アレックス

それは本当です。明確な説明。
-amh

3
実際、2番目の点には同意しません。PCにテストWebサーバーがあり、インデックスが作成されました。アクセスログを確認してこれを見つけました。
バクダン

2
私は新しいドメインを登録し、それらの開発を開始し、数日後にGooglebotがクロールするのを見つけました。私は気がつくまでこれはちょっと気味が悪いと思った- 私はこのドメインを所有する最初の人ではないかもしれない :)彼らは詳細を公開していないが、人々が登録し、ある時点で、少なくとも一定期間、少なくとも数人が訪問しました。
ティムポスト

6

Twitterは別として、GoogleはTumblrをそれほどうまくインデックス付けしていません。Tumblrのブログ投稿は、Tumblr検索を使用して簡単に見つけることができます。また、Googleサイトのすべてはインデックス化されていません(またはほとんどインデックス化されていません)。Googleサイトを開始する場合は、独自のドメインを取得してください。

定期的に更新されない小さなブログは、多くの場合、検索結果からダンプされます。さらに、彼らがスプログだと思うものは何でも。


5

さて、Twitterのコンテンツのほとんどは、たとえ公開されていても、Googleによってインデックス化されていません。以前はGoogleで利用可能でしたが、契約が失効したため、それはもはや事実ではありません。

ソース


真実ではありますが、この質問は、Googleで利用できない「高品質のコンテンツ」です。ほとんどのTwitterはその基準を満たしていないだろう:)しかし、私は奇妙なツイートがGoogle検索に現れるのを見る。
HappyTimeGopher

4

それはあなたがどの国にいるかによります。で、ドイツ政府はあなたのために良いではないと考えて、そして何千ものリストが増加し、毎年ということは、数千のサイトが表示されません。

Googleはインターネット検閲の原動力です。無料のインターネットが必要な場合は、DuckDuckGoなどの悪ではない会社を使用してください。




1

googleがすべてをインデックス化する時間(または傾向)を持っていないほどコンテンツが多いサイト。

クロール可能なサイトマップを持たず、サイトで利用可能な結果にアクセスするためにGoogleが検索用語を提供する必要があるサイトは、完全にインデックスに登録されない場合があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.