これらを異なるパスの大文字化と末尾のスラッシュが異なるURLとして扱うのはなぜですか?


8

これらはすべて厳密に異なるURLです。

http://www.example.com/page
http://www.example.com/pAge
http://www.example.com/page/
http://www.example.com/paGE/

厳しいISO規則に準拠していると思いますが、なぜですか?実際に扱いpagepage/異なるURLとしてアクセスできるWebサイトはいくつありますか?または実際に大文字を使用してコンテンツを区別しますか?彼らがそうした場合、私は彼らがおそらくそれを間違っていると彼らに告げるでしょう。

なぜこれらのルールに準拠するために時間を無駄にしなければならないのですか?Googleがpageそれpage/を解決して同じページであり、おそらく重複コンテンツとして扱われるべきではないのは、かなり簡単なことではないでしょうか。

回答:


10

厳密なISO規則に準拠していると思いますが、なぜですか?

ネット上のさまざまなサーバーの背後にはさまざまなオペレーティングシステムがあり、それらの中には、という名前のディレクトリまたはファイルがとpageは異なるものがありPageます。その結果、これらは実際には2つの異なる場所であり、必ずしも同じタイプの場所(dir / page)である必要はありません。Webサーバーは大文字と小文字を区別しないように構成されている可能性がありますが、それを想定することはできません。したがって、ルールは、事柄大文字と小文字を区別するかどうかを想定し、そうでない場合は何もしません。現実的には、大文字と小文字の違いに依存することはおそらく良い考えではありませんが、状況が存在するため、mod_spelingのように考慮する必要があります。

実際にページとページを別のURLとしてアクセスできるWebサイトがいくつありますか?

彼ら違います。それはほとんど常にあなたから隠されています:

  1. example.com/foo/Webサーバーにアクセスすると、ディレクトリに移動していることが認識されるため、ディレクトリインデックスとして認識するように構成されているファイルと一致するファイルを探します。したがって、最終的にはexample.com/index.html、たとえば、次のようになります。
  2. example.com/fooサーバーにアクセスした場合、実際には、ルートディレクトリでjustという名前のファイルが検索されますfoo。それが見つからない場合は、その後、名前のディレクトリがありますかどうかはチェックし/fooて、あなたは#1まで行くことができます。

#2の「通常の」動作として読んでいるように見えるのは、実際には可能性の高いケースを処理するためのフォールバックです。
拡張子のないファイル名をいくつ使用するかは関係ありません。繰り返しますが、実際の問題。考慮する必要があります。

彼らがそうした場合、私は彼らがおそらくそれを間違っていると彼らに告げるでしょう。

それは意見です。
大文字と小文字を区別しないことや、私が必ずしも同意しない拡張機能のないURLの処理方法について、さまざまな実際的な議論でそれを裏付けることができますが、実際、これを言うのは間違っています。


ケースをいじらないための醜い/イライラする例:私が管理しているサイトがありますが、クライアントのIT担当者が実際のサーバーを管理しています。彼らはすべてのexample.comヒットをwww.example.comにリダイレクトするように設定しましたが、何らかの理由でリダイレクトによってすべてが小文字に強制されました(これは知らされていませんでした)。サイトの編集者がアップロードしていた。CamelCase.jpg。私が制御しなかった他のいくつかのコードは、www なしでそれらの画像にリンクし、私たちがそれを突き止めるまで、あらゆる種類のばかげた破損を引き起こしました。
Su '


8

犯罪は意図されていませんが、今日のURLの大文字と小文字の区別は非常に重要です -1日に何百万回も使用されています。

bit.ly

  1. http://bit.ly/ri2LhQ
  2. http://bit.ly/ri2LHq

大きく異なる2つのサイト-大文字と小文字が区別されるためにのみ可能


3
私がそれをどのようにしたと思いますか?私は少しランダムに変更されたケースから私の1つのURLを取得しました。ユニークなURLを思いつくのに2回かかった。それぞれが同じページであることが比較的明らかである例について...それが正規またはサーバーベースの301リダイレクションの出番です。HTTPプロトコル自体ではなく、URL構造のパワーを担当する必要があります。
Chris Kluis、2011年

5

これはGoogleのポリシーではなく、基本的なルールです。

Windowsユーザーの観点からは、大文字と小文字を区別するファイル名を理解することは困難です。ただし、UNIX / Linuxシステムでは、pAgeとページは同じファイルでもディレクトリでもありません。

末尾のスラッシュは構成の問題(または選択)です。ほとんどのWebサーバーでは、サーバーは/ page two / page /に30xリダイレクトを発行するため、サーバーへの2番目のリクエストが必要になることに注意してください。

Webサーバーで大文字と小文字を区別せず、独自のルールに準拠するように構成できます。

しかし、繰り返しますが、Googleとはまったく関係ありません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.