タグ付けされた質問 「google-search」

Googleの検索エンジン

19
サイトマップのパラドックス
Stack Overflowでサイトマップを使用していますが、私はそれについて複雑な気持ちを持っています。 Webクローラーは通常、サイト内のリンクおよび他のサイトからページを検出します。サイトマップはこのデータを補完して、サイトマップをサポートするクローラーがサイトマップ内のすべてのURLを取得し、関連するメタデータを使用してそれらのURLについて学習できるようにします。サイトマッププロトコルを使用しても、Webページが検索エンジンに含まれることは保証されませんが、Webクローラーがサイトをより適切にクロールするためのヒントを提供します。 サイトマップに関する2年の経験に基づいて、サイトマップには根本的に逆説的なことがあります。 サイトマップは、適切にクロールするのが難しいサイトを対象としています。 Googleがリンクを見つけるためにサイトを正常にクロールできない場合でも、サイトマップでそれを見つけることができる場合、サイトマップリンクに重みを与えず、インデックスを作成しません! それがサイトマップのパラドックスです- サイトが(何らかの理由で)適切にクロールされていない場合、サイトマップを使用しても役に立ちません! Googleはサイトマップの保証を一切行わないようにしています: 「私たちはおよそたり、URLがクロールやGoogleのインデックスに追加されますがあれば、予測または保証することはできません」引用を 「すべてのURLをクロールまたはインデックス登録することを保証しません。たとえば、サイトマップに含まれる画像URLをクロールまたはインデックス登録しません。」引用 「あなたのサイトのすべてのページが検索結果にクロールまたは含まれることを保証するものではありませんサイトマップを提出する」引用 サイトマップで見つかったリンクは単なる推奨事項であるのに対し、自分のウェブサイトで見つかったリンクは正規と見なされます... サイトマップを避けて、Googleや他の検索エンジンが適切にできることを確認することが唯一の論理的なことのようです誰もが見ている普通の標準的なWebページを使用してサイトをスパイダーします。 Googleがあなたのサイトがこれらのページにリンクしていることを確認し、リンクをクロールすることを望んでいるように、あなたがそれをやったときまでに、すっかりスパイダーになっています。サイトマップは、検索エンジンのスパイダーがサイト全体を正常にクロールできるようにすることを妨げるため、積極的に有害になる可能性があります。「ああ、クローラーがそれを見ることができるかどうかは関係ありません。サイトマップでそれらのリンクをたたくだけです!」私たちの経験では現実は正反対です。 これは、サイトマップが非常に深いリンクのコレクションやスパイダーが困難な複雑なUIを持つサイト向けであることを考えると、少し皮肉以上のようです。Googleの経験では、サイトマップは役に立ちません。Googleがサイト上のリンクを適切に見つけられない場合、とにかくサイトマップからインデックスを作成できないためです。Stack Overflowの質問で、この実証済みの問題を何度も繰り返してきました。 私が間違っている?サイトマップは理にかなっており、どういうわけか間違って使用していますか?

8
サイトの直帰率はGoogleのランキングに影響しますか?
Googleでは、サイトのランキングで直帰率などを考慮していますか? 背景:ここでStack Exchangeで、最新のGoogleアルゴリズムの変更により、サーバーフォールトへのトラフィックが約20%低下したことに気付きました(スーパーユーザーへのトラフィックの低下ははるかに小さくなりました)。スタックオーバーフロートラフィックは影響を受けませんでした。 WebProNewsには、バウンス率がGoogleの最新のPandaアップデートのランキングシグナルであると仮定した記事がありました。 Google Analyticsによると、これらは先月の直帰率です。 Site Bounce Rate Avg Time on Site ------------- ----------- ---------------- SuperUser 84.67% 01:16 ServerFault 83.76% 00:53 Stack Overflow 63.63% 04:12 技術的には、Googleには直帰率を知る方法がありません。Googleにアクセスして何かを検索し、最初の結果をクリックしても、Googleは次の違いを判別できません。 コンピューターをオフにするユーザー まったく異なるWebサイトにアクセスするユーザー 上陸したウェブサイトをクリックするのに何時間も費やすユーザー Google が知っていることは、ユーザーがGoogleに戻って別の検索を行うのにどれくらい時間がかかるかです。In The Plex(47ページ)の本によると、Googleは「短いクリック」と「長いクリック」と呼ぶものを区別しています。 短いクリックは、ユーザーがすぐにGoogleに戻って来て、別の検索を行う検索です。Googleはこれを、最初の検索結果が満足のいくものではなかったというシグナルとして解釈します。 長いクリックは、ユーザーが長時間再度検索しない検索です。 この本は、Googleがこの情報を内部的に使用して、独自のアルゴリズムの品質を判断すると述べています。また、誰かが検索のわずかなバリエーションを再入力するショートクリックデータを使用して、「もしかして...?」スペルチェックアルゴリズム。 だから、私の仮説は、Googleが最近、高品質のサイトのシグナルとしてロングクリック率を使用することに決めたということです。誰もこれの証拠を持っていますか?トラフィックを失った(またはその逆)直帰率の高いサイトを見たことはありますか?

5
Google Sitelinksを奨励するために必要な最も重要なことは何ですか?
私のウェブサイトには以前サイトリンクがありましたが、今ではありません。選択肢の数を制限する「インタースティシャル」タイプのランディングページを使用する代わりに、Webサイトをサイドバーデザインに変更したことが原因である可能性は非常に高いですが、よくわかりません。 サイトリンクがサイトを探す方法は次のとおりです。 サイトリンクを取得する可能性を高めるためにできることは何ですか?

6
別のWebサイトがミラーリングされており、検索結果で自分のサイトより上位にランクされています
私のサイトを完全にミラーリングし、現在、私のコンテンツを使用して、Googleの1位にリンクが表示されているthedirtyという悪評のサイトがあります。ログファイルを確認すると、このサイトがしばらくの間私のサイトをクロールしており、サイトから私のサイトへのリンクが10,000個あることに気付きました。 このサイトから参照されているユーザーアクセスをブロックし、既にウェブスパムとしてGoogleに報告しています。また、ドメインを否認しました。 このような極悪な戦術のために、彼らはどのようにしてGoogleでトップリンクを取得しますか(私のものを追い越しますか)?このような問題を完全に排除する手順は何ですか? 更新日2014年8月28日: 詳細がわかりましたので、これについての最新情報を提供すると思いました。そのため、thedirtyはサブドメインを私のIPに向け、サブドメインを私のWebサイトのように見せることができました。 htaccessを使用して、私のドメインではないすべてのホストをリダイレクトして、基本的にGoogleでサブドメイントラフィックリンクを取得することを意味したため、2、3日これはそれほど重要ではありませんでした。数日後、thedirtyはサブドメインを変更してWebサイトを指すようにしたので、この恩恵を受けられなくなりました。 だから、彼らが私のコンテンツを使ってGoogleでトップランクを獲得しているという全体のポイントは、彼らのウェブサイトへのリンクを指し示し、彼らのウェブサイトへのトラフィックを増やしています。 それは汚いウェブサイトによる汚い戦術です。私の希望は、Googleがそのような行動を罰することです。


4
構造化されたURLとSEO用に最適化されたURL
映画サイトの例を見てみましょう。したがって、このサイトの適切に構成されたURLセットは次のようになります。 映画のページ- example.com/movies/the-matrix 映画のレビュー- example.com/movies/the-matrix/reviews 映画の予告編- example.com/movies/the-matrix/trailers 映画の特定の予告編- example.com/movies/the-matrix/trailers/trailer1 リソース名をシームレスに直接削除/追加することでも、リソースをナビゲートすることができます。 SEOの目的のために、私はどこかで2つのページについて、GoogleがとりわけURL階層で検索クエリを持っているページを好むことを読みました。したがって、指定された2つのURLとクエリ「マトリックストレーラー」に対して example.com/movies/the-matrix/trailers example.org/trailers/the-matrix/ ` Googleは、3番目のレベルに「トレーラー」がある最初のURLと比較して、1番目のレベルにキーワード「トレーラー」があるため、2番目のURLを好む場合があります(URL階層の深いリソースはそれほど重要ではないかもしれません)。 正しい場合、URL階層を次のように作成したくなるかもしれません 映画のページ- example.com/movies/the-matrix 映画のレビュー- example.com/reviews/the-matrix/ 映画の予告編- example.com/trailers/the-matrix/ 映画の特定の予告編- example.com/trailers/the-matrix/trailer1 シームレスな階層が壊れます。 私の質問は: 他のサイトのURLと比較するとき、URL階層のより深いリソースはそれほど重要でない傾向があるのは本当ですか? このSEOの最適化にとって、意味のあるシームレスな階層を犠牲にする価値はありますか?
23 seo  url  google-search 

3
遅延読み込み画像とSEOの効果
次の手法を使用して、サイトの画像を遅延読み込みします。 すべての画像について、src属性にデフォルトのimg(ローダー)のURLを入れ、実際の画像のURLをdata-src属性に入れます。そのようです <img src="loader.gif" data-src="img1.jpg" /> 画像がビューポートの外側にある場合は何も起こりませんが、画像がビューポートの内側にある場合、data-src属性からのURL が読み込まれ、画像が正しく表示されます。 この結果、Googleはページ(つまり、検索結果ページ)内のすべての画像が同じsrc属性を持っていると見なします。Googleボットはもちろん、デフォルトの 'unloaded' imgタグのみを解析するためですsrc。 私の質問は、同じsrc属性を持つ多くのimgタグがページのSEOに影響するかどうかです。

2
Google検索結果スニペットのわかりやすい/リッチURLとは何ですか?
Googleでコンテンツを検索するとき、私たちが毎日見ている通常のURLの代わりに、ドキュメントの整然と整理された場所を見ることがあります。 この機能についてしっかりと検索した後、質問に対する答えが見つかりませんでした。この機能の名前を明確にしてください。また、オプションとして、私のWebサイト用にこのようなものを作成する方法を教えてください

2
Googleの検索結果にrobots.txtで許可されていないページが含まれているのはなぜですか?
私のサイトには検索エンジンを遠ざけたいページがいくつかあるので、次のようにrobots.txtファイルでそれらを禁止しました。 User-Agent: * Disallow: /email しかし最近、Googleが検索結果でこれらのページへのリンクを時々返すことがあることに気付きました。なぜこれが起こるのですか、どうすれば停止できますか? バックグラウンド: 数年前、私は私の親relativeが関係しているクラブの簡単なウェブサイトを作りました。彼らは自分のページにメールリンクを入れたいと思っていました。スパムリストは、直接mailto:リンクを使用する代わりに、自分のサイトで実行されている単純なリダイレクタ/ アドレスハーベスタトラップスクリプトを指すようにしました。このスクリプトは、実際のmailto:URL への301リダイレクト、または疑わしいアクセスパターンを検出した場合、ランダムな偽の電子メールアドレスを多く含むページと、そのようなページへのリンクを返します。正当な検索ボットをトラップから遠ざけるために、robots.txt上記のルールを設定し、正当なリダイレクタリンクとトラップページの両方のスペース全体を許可しません。 しかし、つい最近、クラブのメンバーの1人がGoogleで自分の名前を検索しました。最初のページの結果の1つがリダイレクタースクリプトへのリンクであり、電子メールアドレスで構成されるタイトル私の名前。もちろん、彼らはすぐに私に電子メールを送り、Googleのインデックスからアドレスを取得する方法を知りたいと思っていました。GoogleがそのようなURLをインデックスに登録するという考えがまったくなかったので、私も非常に驚きましたrobots.txt。 私はどうにかしてGoogleに削除リクエストを送信しましたが、うまくいったようですが、Googleがrobots.txtそのようなことを回避している理由と方法と、許可されていないページが表示されないようにする方法を知りたいですの検索結果。 追伸 この質問の準備中に、実際に可能な説明と解決策を見つけました。これを以下に投稿しますが、他の誰かが同じ問題を抱えている可能性がある場合は、とにかく質問したいと思いました。あなた自身の答えを投稿してください。また、他の検索エンジンもこれを行うかどうか、そして同じソリューションがそれらにも機能するかどうかを知ることに興味があります。

6
Googleは投稿の公開日をどのように認識しますか
Googleで何かを検索すると、その下に投稿/記事の公開日が表示されることがあります。また、Wordpressを使用したサイトで自分の記事を検索しましたが、Googleはその発行日も認識しています。 ウェブサイトのソースを開いても、特別なタグや公開日を示すものは表示されません。それは通常のdivでのみ書かれており、SEにそれが発行日であることを伝える特別なタグは付けられていません(ページの他の日付もあります)。 DOMツリーのWordpressの公開日の正確な場所をGoogleにハードコーディングしていますか、それとも何かが足りませんか? 私は自分のCMSを使用して新しいWebサイトを構築しています。日付公開された認識を実装する方法を探しています。

3
Googleに表示されるタイトルと異なるタイトルタグ?
IGN.comのタイトルタグにこれがどのように含まれているのか、疑問に思っています。 IGNでのビデオゲーム、攻略、チュートリアル、ゲームトレーラー、レビュー、ニュース、プレビュー、ビデオ Googleでは、そのタイトルは単に「IGN」です。 どうすればそのようなことを達成できますか?表示できない特別なメタタグを使用していますか?

2
会社に関するSchema.org組織データをすべてのページに表示する必要がありますか?
JSON-LD構造化データをWebサイトに追加したので、Googleは会社に関する情報(会社名、URL、ロゴ、住所など)を認識します。Googleのドキュメントのテンプレートから作業しました。 答えが見つからなかった1つのことは、このJSON-LDスニペットをWebサイトのどこに正確に含めるべきかということです。今のところ、私はそれをホームページにしか持っていません。検索エンジンがすべてのページに組織のマークアップを表示するのが悪く見えるかどうかは知りませんでした。しかし、推奨事項はありますか? 会社に関する組織マークアップをすべてのページに含めるか、特定のページにのみ含める必要がありますか?

4
サイトがハッキングされました。+で始まるすべてのURLをGoogleから削除する必要があります。robots.txtを使用しますか?
robots.txtGooglebotがこのようなURLをブロックしてインデックス作成を停止する方法を教えてください。 http://www.example.com/+rt6s4ayv1e/d112587/ia0g64491218q 私のウェブサイトはハッキングされましたが、ハッカーはGoogleで5000個のURLのインデックスを作成し、ランダムリンクでエラー404が発生しました/+。 GoogleウェブマスターツールからこれらのURLを手動で削除する以外の簡単な方法があるかどうか疑問に思っていましたか? signでrobots.txt始まるURLでこれをブロックできます+か?

2
ページの古さを知る方法は?
Googleは、だれが最初にテキストを投稿し、誰がコピーしたかを判断するのに、多少なりとも正確だと思いました。ただし、「検索ツール:カスタマイズされた間隔」を使用すると、結果が非​​常に奇妙になります。私が数年しか持っていなかったウェブサイトの2002年にさかのぼるページを見つけました。 そのため、Googleは、誰がオリジナルをコピーし、誰が書いたのかを正確に知ることができません。とは? stackexchange.com2009年に作成された場合、これはどのように可能ですか?hermeneutics.seスタックオーバーフローよりも古い!

4
Googleは偶然にサイトのアドレスをインデックスに登録しました。私は今何をしますか?
私は私の友人のためにサイトを作成していましたが、彼はそのサイトでの作業中に私の進捗を確認したかったので、自分のコンピューター上のサーバーにサイトを置き、登録されたドメイン名によるアクセスを有効にすることにしました。 robots.txtサイトのファイルを設定するのを忘れて、どういうわけかGoogleがサイトのインデックスを作成したことがわかりました。 私の質問は次のとおりです。 私が理解しているように、Googleはコンテンツの複製を好まないため、新しいサイトを自分のサーバーにアップロードすると、友人に問題が発生する可能性があります。 現在、彼の現在のサイトは、作業中のページのみがあり、関連するキーワードを検索するときにGoogleで最初に表示されます。私は本当にそれを傷つけたくありません。 他に心配する必要があるものはありますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.