会社は私のウェブサイトをクロールする権利を暗示していますか?


30

McAfee SiteAdvisorがWebサイトを「セキュリティの問題がある可能性がある」と報告していることがわかりました。

McAfeeが自分のWebサイトについてどう思うかはあまり気にしません(自分でセキュリティを確保できますが、そうでない場合、McAfeeは間違いなく私が助けを求めている会社ではありません、ありがとうございました)。しかし、私を悩ませているのは、彼らが私の許可なしに私のウェブサイトをクロールしたようです。

明確にするために:私のウェブサイトにはまだほとんどコンテンツがなく、私の個人的な使用のためのいくつかのプレースホルダーといくつかのファイルがあります。ToSはありません。

私の質問は次のとおりです。McAffeeは私のウェブサイトからコンテンツをダウンロード/クロールする権利を持っていますか?禁止することはできますか?ある種の「私の城、私のルール」の原則があるべきだと感じていますが、基本的にすべての法的事項については何も知りません。

更新:おそらく、サーバープロバイダーがSiteAdvisorの調査結果に関するメールを定期的に私に送信することを言及すべきでした。


78
あなたは人間があなたのウェブサイトを見る権利を持っていると言いますか?はいの場合、なぜ人間のロボット召使いを差別するのですか?そうでない場合、そもそもなぜWebサイトなのでしょうか?
jwodder

47
SiteAdvisorがサイトにフラグを立てていることをどのようにして見つけましたか?あなたは彼らのサイトを見なかったのですか?もしそうなら、何があなたに権利を与えましたか?
ジョースナイダーマン

17
ちなみに、SiteAdvisorのレポートをそれほど軽んじることはありません。一般的に、それらが合法的なレポートを見つけたときです。最も一般的なケースは、人気のあるCMS(WordPress、Joomla、Drupalなど)の古い/パッチが適用されていないバージョンが、自動スクリプトによって悪用され、悪意のあるコンテンツ(スパム/フィッシング、詐欺メール、ブラウザの悪用、名前を付けます); 知らないうちに悪いものをホストしている可能性があります。また、多くのユーザーはそのようなツールに依存しているため、このような警告はユーザーを怖がらせる可能性があるため、通常はクリーンな記録が必要です。
マッテオイタリア

35
何かをロックダウンする場合は、ロックダウンします。Webサイトを作成し、GET要求に応答するようにサーバーを構成しました。皆さんを招待しました-文字通り、皆さん。これは「暗黙の」権利ではなく、ウェブサーバーの仕組みです。前述のとおり、robots.txt、IPの制限、またはログインユーザーに制限されているコンテンツは禁止されています。
mfinni

20
@RolazaroAzeveires:自動化されたプロセスは、人間の訪問者を許可することで暗示されるのではなく、攻撃がない限り、「これらのファイルを入手できますか?」そして、応答するようにWebサーバーを構成しました:「もちろんです!どうぞ。他に何か必要ですか?」それはあなたの許可なしにクロールするのではなく、あなたの許可を得てクロールするのです。
マルクストーマス14

回答:


49

これには法的先例があります。Field v。Google Inc.、412 F. Supp。2d 1106、(米国連邦裁判所ネバダ州2006)。Googleはいくつかの要因に基づいてサマリジャッジメントを勝ち取りました。最も顕著なのは、作成者がWebサイトのメタタグでrobots.txtファイルを使用しなかったことです。これにより、Webサイトの所有者がインデックスを作成したくないページをクロールおよびキャッシュできなくなりました。

裁定pdf

robots.txtファイルを具体的に扱う米国の法律はありません。ただし、別の裁判では、最終的にrobots.txtファイルがコンテンツを保護するために行われた意図的な電子的対策を回避するものと見なされる可能性があるという先例を設定しました。HEALTHCARE ADVOCATES、INC Vs HARDING、EARLEY、FOLLMER&FRAILEY、et。al、Healthcare Advocatesは、hardingらがrobots.txtファイルの新しいバージョンを持つページのキャッシュされたファイルにアクセスするために、基本的にWayback Machineの機能をハッキングしたと主張しました。ヘルスケア支持者はこの訴訟を失いましたが、地裁は、問題はハーディングらが「ロックを選んだ」ことではなく、ファイルへのアクセスを許可したWayback Machineのサーバー負荷問題のためにファイルにアクセスしたことであると指摘しましたすべきではないときにキャッシュされたファイル

裁判所の判決pdf

誰かがこの裁定を取り、それを横に回すのは時間の問題です:裁判所は、robots.txt クロールを防ぎ、それ ロックを選ぶことを回避するためのロックであることを示しました。

これらの訴訟の多くは、残念ながら「許可されていないことをクローラーに伝えようとしましたが、クローラーはこれらの設定/コマンドを無視しました」ほど単純ではありません。これらすべてのケースには、robots.txtファイルを米国DCMAの法律で電子的保護方法と見なすべきかどうかというコア問題よりも最終的に結果に影響を与える他の多くの問題があります。

そうは言っても、これは米国の法律であり、中国の誰かが望むことをすることができます-法的問題のためではなく、中国が米国の商標と著作権保護を強制しないので、幸運を祈ります。

短い答えではありませんが、あなたの質問に対する短い、簡単な答えは本当にありません!


1
これは素晴らしい答えです、ありがとう。robots.txtが気に入らないのは、それが実際の標準ではないということです(法律で定められた標準はありません)。これらの企業は単にそれを無視することができます。私は、彼らが私に言うの位置にいるようなない「あなたはrobots.txtファイルを置く必要があり、多分私達はあなたのウェブサイトをクロールしませんが、多分私たちは、私たちは私たちのように行います。」WebサイトのメタデータにWebサイトのToSを指定するための標準があれば、それは素晴らしいことです。
クラリク14

5
@jcankerこれらの2つのケースは、著作権侵害の申し立てに関するものです。Googleやarchive.orgが運営するコンテンツのようにコンテンツをキャッシュするクローラーの動作では、著作権の問題が発生することは完全に理にかなっています。しかし、McAfee SiteAdvisorは、アクセスするWebサイトから実際にコンテンツをコピーして保存する(公開することはほとんどありません)のではありませんか?私は弁護士ではありませんが、この区別は、robots.txtを尊重するかどうかに関係なく、どちらの場合もSiteAdvisorのようなシステムの動作に何らかの形で適用できることを非常に強く疑う理由になると思います。
エリアケイガン

12
@kralyk-re「これらの企業は単にそれを無視することができます。」。はい、そうです。それがインターネットの仕組みです。そして、たとえそれが何らかの基本的なものであったとしても、クローラーがあなたのWebページにアクセスしている人間のふりをするのは些細なことであり、絶対に些細なことです。あなたは技術的に不可能を求めています。確かに、あなたが求めていることを考えてみると、求めるものは論理的ではなく、意味がありません。法的な区別を除きます。唯一可能な保護は、(1)重要なコンテンツをユーザーログイン認証の背後に隠すこと、および(2)この回答で説明されている法的保護です。
ToolmakerSteve 14

@ToolmakerSteveロボットを完全に禁止することは技術的に不可能だと知っています。ただし、これは別の状況です-技術的な解決策を探しているのではなく、合法かどうかを尋ねています。また、McAffeeが私のWebサイトをクロールすることを通知しているので、それを検出する必要はありません。
クラリク14

他の方法で法的な先例もあります:ebay v入札者のエッジ
ジョン14

91

はい、彼らはそうする権利を持っています-あなたは公開ウェブサイトを作成しました、あなたは彼らがそうではないと思うのはなぜですか?

もちろん、あなたにも彼らを止める権利があります。robots.txtを使用してWebサイトをクロールしないように依頼したり、fail2banなどの方法でWebサイトへのアクセスを積極的に防止したりできます。

あるいは、それについて心配せずに、あなたの人生を続けてください。それは何も傷つけず、間違いなくインターネット調査の良性側にあります。


4
> 「はい、彼らにはそうする権利があります。あなたは公開ウェブサイトを作成しましたが、なぜそうしないと思いますか?」 まあ、何かが技術的に可能であれば、それが必ずしも合法であるという意味ではありません。たとえば、YouTubeのToSは動画のダウンロードを禁止しているため、技術的に非常に簡単ですが、依然として許可されていません。それは私のサイト「多分問題を持つ」について私に電子メールを送り、私のプロバイダのためではなかった場合、私は... SiteAdvisorの心配はない
kralyk

16
@kralyk-パブリック(McAfeeを含む)がそれを見ることを望まない場合は、Webに公開しないでください。とても簡単です。あなたはあなたのウェブサイトを管理します。誰もあなたにそれをそこに置くことを強制しません、そして、あなたが人々にそれを見させたくないなら、それをそこに置いてはいけません。あなたがそこにそれを出すつもりなら、人々(あなたのものを売りたい人々を含む)がそれを見ていることに驚かないでください。あなたの欲望を他の誰かの問題に変えようとするのをやめてください。
マイケルコーン14

9
@kralyk:本当ですか?あなたは本当にここの問題が二重の標準だと思いますか?マカフィーの誰もあなたのウェブサイトを知りませんし、気にしません。彼らもそうすべきではありません。Webをクロールする人が全員のToSを読むことを期待するのはばかげているでしょう。それがrobot.txtが発明された理由です。
ToolmakerSteve 14

3
@kralyk対象のリソースへのアクセスは、ToSを意味のある場所に近づけるためにゲートする必要があります。保護されていないページをクロールするロボットは、アカウントを登録し、ToSを確認してから資格情報をロボットに送信する人とはまったく異なります。
アンドリューB 14

4
@kralyk-サイトにどのようなTOSがあり、マカフィーが違反していると感じていますか(尊敬していません)?
ケビンフェガン14

11

この行動が倫理的かどうかは完全に明確ではありません。

公開サイトをクロールする行為自体は、非倫理的ではありません(robots.txtまたはその他の技術的手段を使用して明示的に禁止し、回避している場合を除く)。

彼らがしていることは、あなたに電話をかけるのとほぼ同じですが、あなたが安全でない可能性があることを世界に知らせます。それがあなたの評判を傷つけ、正当化されない場合、それは非倫理的です。それがそれであり、それに対する唯一の解決策があなたが彼らに支払うことを伴う場合、それは暴行です。しかし、私はこれが起こっているとは思わない。

これが非倫理的になるのは、誰かがあなたのサイトをクロールしてコンテンツやデータを適切なものにし、それを自分のものとして表現するときです。しかし、それもまた起こっていることではありません。

したがって、この場合の彼らの行動は倫理的であり、おそらくあなたはそれを無視することもできます。

あなたにスパムを送るという彼らの関連した行動は、あなたが彼らと関係がなく、電子メールをリクエストしなかった場合、非倫理的です。


1
Disallowrobots.txtファイルのディレクティブを「技術的手段の禁止」と呼ぶかどうかわかりません。robots.txtは礼儀正しいリクエストとして機能し、行儀の良いボットはそれを順守しますが、義務も実際のセキュリティも関与しません。実際には、ひどく行儀ボットはよくクロールに招待状などのrobots.txtのエントリを取るかもしれない特定のパス...
からCVn

2
@MichaelKjörling、半分だけが同意します。本当のセキュリティはありませんが、義務があります。それは立ち入り禁止のサインであり、あなたは入場する許可を持っていないので立ち入り禁止にする義務があります。
ベン14

ロックのない「立ち入り禁止」の標識です。あなたの家でそれを試して、泥棒が電話をしてきた後にどれだけの同情を得るかを見てください!(実際には、ロックアウトされたドアと窓を明示的にリストする「
立ち入り禁止

2

特定の人々や企業があなたのウェブサイトにアクセスするのをブロックする技術的アプローチ:

特定のIPアドレスまたはアドレスの範囲がサイトのページにアクセスするのをブロックできます。これは.htaccessファイルにあります(サイトがApache Webサーバーで実行されている場合)。

http://www.htaccess-guide.com/deny-visitors-by-ip-address/

Webサーバーにアクセス元のIPアドレスを記録させ、それらのIPアドレスを検索して、McAfeeに関連付けられているものを見つけます。定期的な訪問者がいない場合は、おそらく簡単にわかります。

もちろん、将来IPアドレスを変更する可能性があります。それでも、見つけたIPアドレスを調べて、それらの所有者を確認すると、McAfeeが所有するアドレスのブロック全体について学習し、それらすべてをブロックできる場合があります。


そうするための法的根拠:

「ウェブサイトの所有者は一部のユーザーを法的にブロックできる、裁判所の規則」

http://www.computerworld.com/s/article/9241730/Website_owners_can_legally_block_some_users_court_rules

(あなたのウェブサイトが個人的なものである場合、誰も一部のユーザーをブロックするあなたの権利に異議を唱えることはありません。しかし、それが企業のウェブサイトである場合、その議論の両側に法的および道徳的な議論があります。それは法的に保護されるべきです-そして、とにかく文句を言うのに十分な他の誰も気にしません。)


「リファラーによる訪問者の拒否」にも興味があるかもしれません。

「ログを見てトラフィックの驚くべき増加に気付いたが、実際のファイルリクエストが増えていないのは、おそらくコンテンツ(CSSファイルなど)をつまんでいる人か、Webサイトをハッキングしようとしている人(これは単に非公開コンテンツを見つけるため)。」

http://www.htaccess-guide.com/deny-visitors-by-referrer/

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.