Googlebotは、認証されたユーザーにのみ表示されるURLをどのように検索しますか?


12

これは私のアカウントの1つで、アカウントにログインした後に何らかのアクションを実行しています。一意のトークンは、単に暗号化されたユーザーID +タイムスタンプです。

94.254.xxx.xxx--[02 / Jul / 2011:22:25:46 +0200] "GET / some-action / unique-token-123abc HTTP / 1.1" 200 410 "-" "Mozilla / 5.0(互換性あり; MSIE 9.0; Windows NT 6.1; Trident / 5.0) "

さて、Googlebotはどういうわけかこのユニークなリンクを見つけ、1週間後にまったく同じURLにアクセスしようとしました。

66.249.71.179--[10 / Jul / 2011:09:56:01 +0200] "GET / some-action / unique-token-123abc HTTP / 1.1" 302-"-" "Mozilla / 5.0(互換性; Googlebot / 2.1; + http://www.google.com/bot.html) "

(トークンの有効期限が切れていたため、ステータスコードは302です)


これが一意のURLであり、ユーザーがクリックしてそのページにアクセスする前に、2秒間だけ1回だけ表示されたことを強調します。電子メールで送信されたり、一般公開されていません。

ここで何が起こっているのですか、Googleがこの一意のURLを見つけた可能性はありますか?

回答:


6

確かに言うのは難しいですが、可能性の高いシナリオは次のとおりです。

  • ユーザーには、ブラウザのツールバーまたは拡張機能がインストールされており、GoogleにアクセスしたURLを報告します。

  • 誰かがそのURLにリンクし、Googleはそのリンクを含むページをクロールしてそれを見つけました。


Googleツールバーについては、「PageRank」機能を有効にした場合にのみURLをGoogleに返信しますが、そのデータを使用して新しいURLを検出することはありません。私たちがリリースした他のツールバーについては、教えてください。
メソッド

5

ユーザーがこの認証済みページでアウトバウンドリンクを見つけて、Referer他のWebサイトにクリックスルーするときのようにプライベートURLをリークしているに違いないことに気付きました。これが唯一の可能な説明であり、本当に最初から明らかだったはずです。

漏洩したプライベートURLは、さまざまな方法でGoogleに公開されている可能性があります。たとえば、ターゲットサイトがアクセスログを公開している可能性があります。注:アウトバウンドリンクはいずれもGoogleアナリティクスを使用していないため、GooglebotがアナリティクスのリファラーURLを使用していることを示しているわけではありません。

再学習したレッスン: httpsを使用しない限り、URLに機密データを決して入れないでください。httpsを使用すると、ブラウザーはReferer空のままになります。


1
そのとおりです。URLに機密データを入れることは危険です。可能な限り、POSTリクエスト(GETリクエストなどのURLの一部として変数を送信しない)を使用するか、Cookie /セッション変数を使用して、ページ間で一意のユーザーIDを渡す必要があります。
ニック
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.