ウェブマスター

プロウェブマスターのためのQ&A


30
バックアップなしで失われたウェブサイトを回復しますか?
残念ながら、ホスティングプロバイダーは100%のデータ損失を経験したため、2つのホストされたブログWebサイトのすべてのコンテンツを失いました。 http://blog.stackoverflow.com http://www.codinghorror.com (はい、はい、完全なオフサイトバックアップを実行する必要がありました。残念ながら、すべてのバックアップはサーバー自体に保存されていました。講義を保存してください。ここで質問に集中してください!) 私は、WebクローラーのキャッシュからWebサイトを回復する、遅くて苦痛なプロセスを始めています。 Warrickなど、インターネットWebスパイダー(Yahoo、Bing、Googleなど)キャッシュからWebサイトを回復するための自動化されたツールがいくつかありますが、これを使用していくつかの悪い結果がありました。 私のIPアドレスはすぐにGoogleから使用を禁止されました 500エラーと503エラーが大量に発生し、「5分間待機しています...」 最終的には、テキストコンテンツを手作業ですばやく回復できます すべてのブログ投稿のリストを使用して、Googleキャッシュにクリックスルーし、個々のファイルをHTMLとして保存することで、幸運を得ることができました。ブログの記事の多くがありますが、存在しないこと、多くの、そして私は、私はより良いバックアップ戦略を持っていないため、いくつかの自責に値する把握。とにかく、重要なことは、この方法でブログの投稿テキストを取得できて幸運だったことです。また、インターネットキャッシュからWebページのテキストを確実に取得できます。これまでに行ったことに基づいて、失われたブログ投稿テキストとコメントをすべて回復できると確信しています。 ただし、各ブログ投稿に伴う画像は証明されていますが…もっと難しいです。 任意の一般的なインターネットのキャッシュからのウェブサイトのページを回復するためのヒント、そして特に、場所はするウェブサイトのページからアーカイブされた画像を回復しますか? (また、バックアップの講義はありません。あなたは完全に、完全に、まったく正しいです!しかし、正しいことは私の差し迫った問題を解決していません...あなたがタイムマシンを持っていない限り...)

19
サイトマップのパラドックス
Stack Overflowでサイトマップを使用していますが、私はそれについて複雑な気持ちを持っています。 Webクローラーは通常、サイト内のリンクおよび他のサイトからページを検出します。サイトマップはこのデータを補完して、サイトマップをサポートするクローラーがサイトマップ内のすべてのURLを取得し、関連するメタデータを使用してそれらのURLについて学習できるようにします。サイトマッププロトコルを使用しても、Webページが検索エンジンに含まれることは保証されませんが、Webクローラーがサイトをより適切にクロールするためのヒントを提供します。 サイトマップに関する2年の経験に基づいて、サイトマップには根本的に逆説的なことがあります。 サイトマップは、適切にクロールするのが難しいサイトを対象としています。 Googleがリンクを見つけるためにサイトを正常にクロールできない場合でも、サイトマップでそれを見つけることができる場合、サイトマップリンクに重みを与えず、インデックスを作成しません! それがサイトマップのパラドックスです- サイトが(何らかの理由で)適切にクロールされていない場合、サイトマップを使用しても役に立ちません! Googleはサイトマップの保証を一切行わないようにしています: 「私たちはおよそたり、URLがクロールやGoogleのインデックスに追加されますがあれば、予測または保証することはできません」引用を 「すべてのURLをクロールまたはインデックス登録することを保証しません。たとえば、サイトマップに含まれる画像URLをクロールまたはインデックス登録しません。」引用 「あなたのサイトのすべてのページが検索結果にクロールまたは含まれることを保証するものではありませんサイトマップを提出する」引用 サイトマップで見つかったリンクは単なる推奨事項であるのに対し、自分のウェブサイトで見つかったリンクは正規と見なされます... サイトマップを避けて、Googleや他の検索エンジンが適切にできることを確認することが唯一の論理的なことのようです誰もが見ている普通の標準的なWebページを使用してサイトをスパイダーします。 Googleがあなたのサイトがこれらのページにリンクしていることを確認し、リンクをクロールすることを望んでいるように、あなたがそれをやったときまでに、すっかりスパイダーになっています。サイトマップは、検索エンジンのスパイダーがサイト全体を正常にクロールできるようにすることを妨げるため、積極的に有害になる可能性があります。「ああ、クローラーがそれを見ることができるかどうかは関係ありません。サイトマップでそれらのリンクをたたくだけです!」私たちの経験では現実は正反対です。 これは、サイトマップが非常に深いリンクのコレクションやスパイダーが困難な複雑なUIを持つサイト向けであることを考えると、少し皮肉以上のようです。Googleの経験では、サイトマップは役に立ちません。Googleがサイト上のリンクを適切に見つけられない場合、とにかくサイトマップからインデックスを作成できないためです。Stack Overflowの質問で、この実証済みの問題を何度も繰り返してきました。 私が間違っている?サイトマップは理にかなっており、どういうわけか間違って使用していますか?

7
ICANNがドメイン名ごとに18セントしか請求しない場合、なぜ10ドルを支払うのですか?
ICANNは、その拡張子に関係なく、登録されたドメイン名ごとに18セントを請求しますが、私はレジストラでドメイン名に年間10ドルを支払います。 この追加の$ 9.82を正当化するために、顧客のためにドメイン名レジストラは何をしますか? ICANNに登録する以外に、彼らが私たちのドメイン名に対して行うことはありますか? ICANNデータベースキーを保持している7人について読んだところ、ドメインネームサーバーがこの追加額(実際の料金の12倍)を正当化するために何をするのか少し知りたいのですが?

12
ドメイン登録中に偽情報を提供する-それは重要ですか?
ご存知のように、すべてのドメインレジストラは既に個人情報を要求しています。 そのような個人情報には以下が含まれます。 姓と名 住所情報 電子メールアドレス 電話番号 WHOISを介した個人情報 TLDやccTLDなどのドメインタイプによっては、単純なwhoisを介してドメインを登録すると、この情報がすぐに利用可能になる場合があります。あなたがそれを望まない場合(そしてほとんどの場合、あなたは確かにそうしません)、彼らはあなたがwhoisサービスからこの情報を削除できるサービスを提供しますが、もちろんあなたの個人情報を隠すことはドメイン購入に年間費用を追加します。 ドメインの登録時に偽の詳細を使用するとどうなりますか?

15
Googleアナリティクスを公式に使用するには大きすぎるサイトですか?
Google Analyticsチームからこのメールを受け取りました。 私たちはあなたが私たちの製品を愛し、あなたと同じようにそれを使うことを愛しています。ただし、Google Analyticsで追跡しているWebサイトが1日あたり100万件以上のヒットをGoogle Analyticsサーバーに送信していることがわかりました。これは、Googleアナリティクスの利用規約で指定されている「アカウントごとの月間500万ページビュー」の制限を大きく上回っています。 このデータ量を1日に複数回処理すると、貴重なリソースが消費され、すべてのGoogleアナリティクスユーザー向けに製品を開発し続けることができます。 そのため、2010年8月23日から、レポートの指標は1日1回更新されますが、1日の間に複数回更新されることはありません。通常どおり、Googleアナリティクスのすべてのレポートと機能を引き続き受け取ります。唯一の変更点は、特定の日のデータが翌日に表示されることです。 この変更の理由をご理解ください。 私はこの決定を完全に尊重し、私たちを追い出さないことは非常に寛大だと思います。 しかし、これを正しい方法で行うにはどうすればいいですか?1日あたりのヒット数が多い「クジラ」ウェブサイトの場合、Google Analyticsを使用するGoogleの公式の祝福された方法は何ですか? または、非常に大規模なWebサイトに適した他の分析サービスはありますか?

2
ページタイトルでキーワードの順序は重要ですか?
Stack Overflowはページタイトルを変更して、質問の最も人気のあるタグがタイトルの先頭に表示されるようにしました。変更はネットワーク全体に展開されているため、この質問のページタイトルを確認してください。 以下のために、質問のタイトルやページタイトルの比較この質問: 質問のタイトル: ASP.NET MVC3 RCを使用しても安全ですか? ページタイトル: asp.net mvc-ASP.NET MVC3 RCを使用しても安全ですか?- スタックオーバーフロー Googleで上位にランク付けされているスクレイパーを停止しようとする変更を理解しています。最も人気のあるタグをページタイトルに追加するのは良い考えのようです。 しかし、私が気づいている副作用は、多くのタブが開いていることです。今、私が見ることができるタイトルの唯一の部分はタグです。このキーワードをページタイトルの後の方に移動すると、SEOを改善するためのこれらの努力が損​​なわれますか? 可能なタイトル: ASP.NET MVC3 RCを使用しても安全ですか?-asp.net mvc-スタックオーバーフロー

9
要件を満たすWebホスティングを見つける方法
これは、Webホスティングの選択に関するすべての質問に対する答えとして機能するように設計された「キャッチオール」質問です。Pro Webmastersは、ホスティングの選択方法に関する新しい質問を受け付けなくなりました。Webホスティングの検索に関する将来の質問はすべて、この質問の複製として終了する必要があります。このポリシーの詳細については、このメタの質問を参照してください。 要件を満たすWebホスティングを見つける方法 この質問への回答で私たちが探しているのは、ウェブホスティングの基本です: Webホスティングとは何ですか? 共有、VPS、および専用ホスティングの違いは何ですか? コンテンツ配信ネットワークはWebホスティングとどのように関連していますか? あなたが感じる何か他のものは、ウェブホストを見つけるのに役立ちます。 私たちが望まないのは: 特定のWebホストの推奨または推奨事項 私たちはあなたの経験や他の主観的な情報を望まない(事実だけをお願いします)

5
AcceptとContent-Type HTTPヘッダーの違い
そのため、Acceptヘッダーは、ブラウザが探しているリソースのMIMEタイプをサーバーに伝えます。たとえば、サーバーはプレーンテキスト、HTML、JSONなどを送信できます。 OK、それは理にかなっていますが、Content-Typeヘッダーを見ると同じことをしているようです。たとえば、テキストまたはJSONが必要であることをサーバーに伝えます。 ではAccept、Content-TypeHTTPヘッダーとHTTPヘッダーの違いは何ですか?

5
Google Search ConsoleでのHTTPからHTTPSへの移行
サイト全体でHTTPからHTTPSに移行しています。現在、サイトはGoogle Search Console(以前のGoogle Webmaster Tools)に追加されwww.example.comており、SSLを使用せずにすべてのページがインデックスに登録されます。 Google Search Consoleで新しいHTTPS URLに移動するにはどうすればよいですか? HTTPS URLを含む更新されたサイトマップを送信するだけですか、それとも新しいhttps://www.example.comサイトをHTTPS URLで追加し、サイトマップを送信しますか?現在のすべてのURLは、対応するHTTPSにリダイレクトするように設定されています。 Google Search Consoleに複数のプロパティを追加しますか?


8
SEOとローカリゼーションの両方のURLをどのように構成する必要がありますか?
複数の言語でサイトを設定する場合、検索エンジンと使いやすさのためにURLをどのように設定すればよいですか? 私のサイトがwww.example.comであり、フランス語とスペイン語に翻訳しているとしましょう。ユーザビリティとSEOに最適なものは何ですか? ディレクトリオプション: http://www.example.com/sample.html http://www.example.com/fr/sample.html http://www.example.com/es/sample.html サブドメインオプション: http://www.example.com/sample.html http://fr.example.com/sample.html http://es.example.com/sample.html ファイル名オプション: http://www.example.com/sample.html http://www.example.com/sample.fr.html http://www.example.com/sample.es.html Accept-Languageヘッダー: または、単にAccept-Languageヘッダーを解析し、そのヘッダーに合わせてコンテンツサーバー側を生成する必要がありますか? これを行う別の方法はありますか?異なる言語バージョンに異なるURLがない場合、検索エンジンについてはどうすればよいですか? 更新2011-12-06 Googleにはmeta、他の言語コンテンツを明示的にポイントするためのタグに関する新しい推奨事項があります。多言語コンテンツの新しいマークアップです。 更新2012-05-25 関連するが正確ではない:サイトマップの多言語および多国籍のサイトアノテーション 更新2013-06-12 サイトコンテンツを特定の国にターゲティングするには、質問に直接関連するいくつかのURLスキームの議論が含まれます。

6
ウェブサイトの匿名所有者になるのはどれくらい難しいですか?
非常に急進的な政治的メッセージを持つウェブサイトを作成したいと思います。それは非倫理的ではありません(暴力を助長するなど)が、そこにリストする予定のポイントは間違いなく私をたくさんの敵にするだろうと感じています。 私が誰であるかを知る誰かから私の身元を保護することはどれほど難しいでしょうか?ドメインには常に登録情報を民営化するための10ドル/年のオプションがありますが、他に考えるべき保護はありますか?
110 domains  privacy 

4
ドメインで複数のAレコードを使用する-Webブラウザーは複数のAレコードを試しますか?
ドメインに複数のAレコードを追加すると、DNSサーバーからラウンドロビン順に返されます。 例: 192.0.2.1 A example.com 192.0.2.2 A example.com 192.0.2.3 A example.com しかし、最初のホスト(192.0.2.1)がダウンしている(到達できない)場合、Webブラウザーはどのように反応しますか?2番目のホスト(192.0.2.2)を試しますか、それともエラーメッセージをユーザーに返しますか?最も人気のあるブラウザーに違いはありますか? 独自のアプリケーションを実装する場合、最初のアプリケーションがダウンした場合に2番目のアプリケーションが使用されるように実装できるため、可能です。これは、フォールトトレラントWebサイトを作成するのに非常に役立ちます。

8
サイトの直帰率はGoogleのランキングに影響しますか?
Googleでは、サイトのランキングで直帰率などを考慮していますか? 背景:ここでStack Exchangeで、最新のGoogleアルゴリズムの変更により、サーバーフォールトへのトラフィックが約20%低下したことに気付きました(スーパーユーザーへのトラフィックの低下ははるかに小さくなりました)。スタックオーバーフロートラフィックは影響を受けませんでした。 WebProNewsには、バウンス率がGoogleの最新のPandaアップデートのランキングシグナルであると仮定した記事がありました。 Google Analyticsによると、これらは先月の直帰率です。 Site Bounce Rate Avg Time on Site ------------- ----------- ---------------- SuperUser 84.67% 01:16 ServerFault 83.76% 00:53 Stack Overflow 63.63% 04:12 技術的には、Googleには直帰率を知る方法がありません。Googleにアクセスして何かを検索し、最初の結果をクリックしても、Googleは次の違いを判別できません。 コンピューターをオフにするユーザー まったく異なるWebサイトにアクセスするユーザー 上陸したウェブサイトをクリックするのに何時間も費やすユーザー Google が知っていることは、ユーザーがGoogleに戻って別の検索を行うのにどれくらい時間がかかるかです。In The Plex(47ページ)の本によると、Googleは「短いクリック」と「長いクリック」と呼ぶものを区別しています。 短いクリックは、ユーザーがすぐにGoogleに戻って来て、別の検索を行う検索です。Googleはこれを、最初の検索結果が満足のいくものではなかったというシグナルとして解釈します。 長いクリックは、ユーザーが長時間再度検索しない検索です。 この本は、Googleがこの情報を内部的に使用して、独自のアルゴリズムの品質を判断すると述べています。また、誰かが検索のわずかなバリエーションを再入力するショートクリックデータを使用して、「もしかして...?」スペルチェックアルゴリズム。 だから、私の仮説は、Googleが最近、高品質のサイトのシグナルとしてロングクリック率を使用することに決めたということです。誰もこれの証拠を持っていますか?トラフィックを失った(またはその逆)直帰率の高いサイトを見たことはありますか?

Licensed under cc by-sa 3.0 with attribution required.