タグ付けされた質問 「search-engine-indexing」

特定の単語が発生した場所を記録するプロセス。Webコンテキストでは、検索エンジンがWebをクロールして、特定の単語が含まれているページのリストを作成します。これがインデックスです。

3
検索エンジンがコンテンツのインデックスを作成しないのはなぜですか?
これは一般的なコミュニティWiki キャッチオール質問と回答のペアで、サイトまたは特定のサイトコンテンツが検索エンジンの結果に表示されない理由に関する質問に対処することを目的としています。 あなたの質問がこの質問の複製として閉じられ、ここで提供された情報では十分な回答が得られないと感じた場合は、Pro Webmasters Metaでディスカッションを開いてください。 サイト(またはサイトの特定のページ)が検索エンジンの結果に表示されません。 コンテンツがインデックスに登録されないのはなぜですか?

5
ページはGoogleでインデックス登録されているように見えますが、どの検索キーワードでも検索できませんか?
(ここでスクリーンショットを使用することに注意してください。これについて書くと、時間の経過とともに動作が変わると思われるためです。) Google検索を行う場合 uiviewcontrollerのベストプラクティス 引用符の有無にかかわらず、次のような結果になります。 これらのページはどれも、タイトルにこれらの単語を含む実際のStack Overflowの質問に解決しないことに注意してください。それらは、a)クリエイティブコモンズデータをミラーリングし、属性要件で適切に指定されているnofollowなしでソースの質問を正しく指し示すサイト、またはb)実際の質問ではなく、質問への内部リンクに解決します。 タイトルのある実際のページ... カスタムUIViewおよびUIViewControllerのベストプラクティスですか? ... ん、このURLに存在して... http://stackoverflow.com/questions/3300183/custom-uiview-and-uiviewcontroller-best-practices ...そして、明らかにそれはGoogleのインデックスに存在します! しかし、検索すると表示されないのはなぜですか uiviewcontrollerのベストプラクティス ? 私達はことを知っています Googleのインデックスにこのページが含まれています 検索用語は質問のタイトルと一致します スタックオーバーフローは、Creative Commonsでこの質問を反映している他のサイトよりもはるかに高いページランクを持っています わかりません。ここで何が間違っていますか?

6
PDFファイルが検索エンジンによってインデックスに登録されるのを防ぐ方法は?
この質問は、ウェブマスターStack Exchangeで回答できるため、Stack Overflowから移行されました。 8年前に移行され ました。 公開WebページにPDFドキュメントへのリンクがあります。検索エンジンがこのリンクとPDFドキュメントのインデックスを作成しないようにするにはどうすればよいですか? 私が考えた唯一のアイデアは、CAPTCHAを使用することです。しかし、検索エンジンにリンクとPDFドキュメントのインデックスを作成しないように指示する魔法の言葉があるのだろうか?PHPまたはJavaScriptを使用したオプションも問題ありません。 明確にするためだけに。PDFを暗号化してパスワードで保護したくありません。検索エンジンに対しては非表示にしたいだけで、ユーザーには表示したくないだけです。

4
GoogleサイトマップがGoogle検索結果に表示されないようにします
次のsite:検索クエリの結果のように、GoogleサイトマップファイルがGoogle検索結果に表示されないようにするにはどうすればよいですか。 そもそもGoogleが検索結果にサイトマップファイルを表示することを選択する理由がわかりません。これらのファイルは、人間が使用するためのものではありません。 Googleがクロールして処理できるようにする必要があるため、robots.txtでそれを禁止することはできません。処理後に検索結果に表示させたくないだけです。


13
検索エンジンでインデックス付けされるテキストを含む画像を取得するにはどうすればよいですか?
私は友人のために小さなポートフォリオWebサイトを構築していますが、広告やその他すべてに携わっています。彼女は標準フォントが嫌いで、すべてをカスタムフォントで書くことを望んでいます。 CSSフォント埋め込みは現時点では実際にはオプションではないため、すべてのテキスト(残念ながら多くはありません)は画像として配置されます。 どうすれば画像コンテンツのインデックスを作成できますか?小さなテキスト(リンク、メニューなど)の場合、テキストをalt属性に入れますが、それより長いものについては、それが解決策ではないと思います。私に何ができる ?テキストを画像の横にある非表示のdivに入れますか?

3
Googleはまだクロールし、インデックスに登録していますが、これは古いダミーのテストページで、現在404は見つかりません
サンプルページとデータ(lorem ipsumなど)を使用してサイトをセットアップし、Googleはこれらのページをクロールしました。これらのページをすべて削除し、実際のコンテンツを実際に追加しましたが、ウェブマスターツールでは、Googleがこれらのページをクロールしようとすると404エラーが多く発生します。「解決済みとしてマーク」するように設定しましたが、一部のページはまだ404として返されます。 さらに、Googleで自分のサイトを検索すると、これらのサンプルページの多くがまだリストされています。それらを削除する方法。これらの無関係なページが私の評価を傷つけていると思います。 私は実際にこれらのページをすべて消去し、新しいサイトとして自分のサイトをインデックスに登録し始めたいと思っていましたが、それは不可能だと読みましたか?(サイトマップを送信し、「Fetch as Google」を使用しました。)


4
GoogleでPDFドキュメントのインデックスを作成するにはどうすればよいですか?
GoogleがサイトのPDFファイルのインデックスを作成するのに問題があります。PDFは約50個あり、サイズは20 KBから2メガバイト弱までの範囲です。それらは保護されておらず、匿名で読むことができ、PDF Reader内でドキュメントを検索できます。 それらはSiteMap.xmlにリストされています。IISログを見て、GooglebotがPDFファイルを読み取っているのを見ることができますが、5つを除いて、それらが検索結果に含まれることはありません。 filetye:pdfを実行すると、5つのPDFしか表示されませんでした。PDF内にあることがわかっているテキストを検索した場合、PDFは表示されません(インデックスに登録されている5つを除く)。 45+を超えるPDFドキュメントがサイトマップにあり、Googlebotがそれらを読んでいるにもかかわらず、なぜインデックスに含まれていないのか、誰にもわかりませんか?

2
Google Scholarのインデックス作成、どのタグを使用しますか?
「ではウェブマスターのためのインクルージョンのガイドラインについて、」Googleニュースのインデックス作成のガイドラインの下に書かれています: Google Scholarは、Highwire Pressタグ(たとえば、citation_title)、Eprintsタグ(たとえば、eprints.title)、BE Pressタグ(たとえば、bepress_citation_title)、およびPRISMタグ(たとえば、prism.title)をサポートしています。ダブリンコアタグ(DC.titleなど)を最後の手段として使用する 新しいウェブサイト用。これらのオプション(Eprints、BE PressまたはPRISM)のどれが最適で、これらのタグはどこに文書化されていますか?

3
Googleウェブマスターツールで報告された「site:」検索よりも少ないインデックスページの数
Googleウェブマスターツールでは、309ページのインデックスが作成されていますが、「site:site.com」を使用して検索すると、約180件しか表示されません(最初のページには「約608件の結果」、合計投稿数に近い数が表示されます)。 また、以前インデックスに登録されていた一部のページが単にGoogleから消えていることにも気付きました。Googleウェブマスターツールには、エラーメッセージや、Googleによる罰を示すものはありません。 Googleウェブマスターツールによると、毎日の新しいページはインデックスに登録されますが、何らかの理由で検索に表示されません。 Googleによる罰の影響を本当に受けているのでしょうか、これは何らかのバグですか?この問題を解決し、すべてのページを正常にインデックス化するにはどうすればよいですか?

3
Googleは、リンクのないドメインをどのように見つけますか?
最近、新しいドメインを登録し、それを既存のサーバーにポイントして、「test」とだけ言う最小限のページを設定しました。 今夜、ページが既にGoogleでインデックス登録されていることを発見しました。サイトへのリンクはありません(ドメインについてはまだ何もしていないので、ドメインについては誰にも話していません)。 GoogleはWHOISレコードなどをトロールしていますか?

5
検索エンジンにページの特定のセクションのインデックスを作成させない方法はありますか?
ユーザーが古い投稿に簡単にアクセスできるように、BloggerのセットアップですべてのページにBlog Archiveパネルを表示しています。問題は、このパネルに各ページのタイトルがリストされていることです。つまり、現在のページは、直接関連するのではなく、別のページのキーワードを取得しています。 たとえば、私はオレンジについて書いているかもしれませんが、1週間前に私はリンゴについて書いていました。1週間前のリンゴに関する私の投稿へのリンクが[アーカイブ]パネルにあるので、オレンジに関するページは検索エンジンからもリンゴについて話しているように見えます。リンゴページがオレンジ色のキーワードにもインデックスを付けている場合は、逆のことが当てはまります。 ページの特定のセクションをインデックスから除外する方法はありますか?(たとえば、<div>タグ付けされた全体noindexまたはそれに類似したものを持つようなもの。) Bloggerにはアーカイブパネルのページのタイトルを削除するオプションがあることは知っていますが、利用可能な投稿をユーザーに知らせるために、そこに留まる方がいいと思います。

3
googleonとgoogleoffのコメントを使用して、Googlebotがページの一部をインデックスに登録できないようにできますか?
Googleがページの一部をインデックスに登録しないようにするコードを見ました: <p>This is a paragraph that will be indexed by Google.</p> <!--googleoff: index--> <p>This is a paragraph that will NOT be indexed by Google.</p> <!--googleon: index> これは機能しますか?

6
Googleボットによってインデックス化された数千万のページを取得する方法は?
現在、800万のユニークなページがあり、すぐに約2,000万、最終的には約5,000万以上に成長するサイトを開発しています。 批判する前に... はい、ユニークで有用なコンテンツを提供します。我々は継続的に公的記録からと、エンティティのロールアップをスクラブいくつかのデータを実行して生データを処理し、関係マッピングは、我々は、部分的に、またユニークな非常に便利とのサイトを開発し、質の高いコンテンツを生成することができました原因の広さにデータ。 PRは0(新しいドメイン、リンクなし)であり、1日あたり約500ページの速度でスパイダーされており、これまでに約30,000ページのインデックスが作成されています。このレートでは、すべてのデータのインデックス作成に400年以上かかります。 2つの質問があります。 インデックス作成のレートはPRと直接相関していますか?つまり、PRの良い古いドメインを購入することで、実用的なインデックス作成レート(1日あたり100,000ページ程度)に到達するのに十分な相関があるということです。 インデックス作成プロセス自体を支援することに特化したSEOコンサルタントはいますか。そうでなければ、特にページ上でSEOを非常にうまく活用しています。さらに、「ロングテール」キーワードフレーズの競争は非常に少ないため、成功は主にインデックスに登録されたページ数にかかっています。 当社の主要な競合他社は、Alexa 2000のようなランキングとともに、わずか1年で約20 MMページのインデックスを作成しました。 私たちが持っている注目すべき品質: ページのダウンロード速度はかなり良い(250-500ミリ秒) エラーなし(スパイダーされたときに404または500エラーなし) Googleウェブマスターツールを使用して、毎日ログインします わかりやすいURL サイトマップを送信するのが怖いです。一部のSEOコミュニティの投稿では、数百万ページの新しいサイトが提案されており、PRは疑わしくありません。監視の増加を回避するために、大規模なサイトの段階的なオンボーディングについて話しているMatt CuttsのGoogleビデオもあります(ビデオの約2:30)。 クリック可能なサイトリンクは、すべてのページを提供します。4ページ以下、通常は1ページに250(-ish)以下の内部リンクがあります。 内部リンクのアンカーテキストは論理的であり、詳細ページのデータに階層的に関連性を追加します。 以前、ウェブマスターツールでクロールレートを最高に設定していました(最大で2秒ごとに1ページのみ)。私は最近、「Googleに決定させる」ことを勧めました。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.