クッキーと「訪問者」の標準的な比率は?


31

で述べたように、最近のブログ記事、私たちは見Google Analyticsの「訪問者」とグラフィックQuantcast「訪問者」の間に大きな相違を。

また、理由がわからなかったため、GoogleアナリティクスはQuantcastよりも多くの数値を取得するだけです。現在、GAは、Quantcastがネットワーク全体(1400万)で見ているよりも多くの訪問者(1500万)をstackoverflow.comだけに表示しています

どうして?知りません。GoogleアナリティクスでCookieが失われることもあれば、Quantcastが訪問者を見逃すこともあります。カウントは不正確な科学です。

これは、QuantcastがCookieと訪問者のより保守的な比率を使用しているためだと考えています。GoogleアナリティクスはすべてのCookieを「訪問者」と見なしますが、Quantcastはすべての1.24 Cookieを「訪問者」と見なします。人々は複数のコンピューター、複数のブラウザーなどから当社のサイトにアクセスする可能性があるため、これは理にかなっています。

密接に関連する2つの質問があります。

  1. 訪問者に対するCookieの受け入れられた標準比率はありますか?これは明らかに不正確な科学ですが、新しい経験則はありますか?

  2. ブラウザのCookieに依存する以外に、Webサイトへの「訪問者」をカウントするより正確な方法はありますか?または、これは、どのように測定するかに関係なく、常にベストエフォート型の推定スクラップシュートになりますか?


Quantcastは間違いなくCookieを使用していますよね?彼らは単にIPアドレスか何かに行きませんか?
-DisgruntledGoat

@disgruntledgoat私はウェブサイトをチェックしました:「QuantcastはユニークなCookieカウントと人の両方のオーディエンスデータを提供します。」
マシューブルックス

@DisgruntledGoatは、まさにこのページをチェックしてください。のCookieがありquantserve.comます。
ヤヘル

回答:


14

Quantcastからメールが届いた:

GA番号とQC番号の間にかなり大きなデルタがあるとおっしゃいました。これは頻繁には発生しませんが、実際には発生します。これにはいくつかの理由があります。たとえば、サードパーティのCookieと自動更新は考慮されますが、GAは考慮されません。また、MRCおよびIAB標準に準拠するために、ページの下部にタグを配置するようサイト運営者にお願いします。他の測定タグがページの上位にある場合、Quantcastがそうでないときにそれらが起動する可能性があります。(当社は唯一のMRC認定トラフィック測定サービスです)。また、タイムゾーンを考慮すると、数値がまったく同じになることはありません。正規化関数を使用し、GAは修正されています。

数字の決定方法の詳細については、http//www.quantcast.com/how-we-do-itをご覧ください。また、Cookieが修正されたオーディエンスデータと方法論に関するホワイトペーパーもここにあります。

ホワイトペーパーを熟読すると、彼らは実際にジェフが提案することを行っていることがわかります。「公式」の数字をごまかして、本当の人数に近いと思うものを手に入れます。彼らはしている読者ホワイトペーパー(PDFリンク)クッキーを修正:だけではなく魔法の数で割るような単純なように、彼らのシステムはかなり精巧されていることを意味します

Quantcast Quantified Publisherプログラムは、毎月750億を超えるメディア消費イベントをキャプチャします。これは14億を超えるCookieによって生成されます(データは2008年6月現在)。さらに、Quantified Publisherパートナーの多くは、Cookieに依存しない匿名識別子を共有しています。このモデルには、Cookieを削除しない人ベースの参照ポイントとキャリブレーションを提供するいくつかのパネルも含まれています。さまざまな収集プロセス、バイアス、問題を抱えたこの大量のデータを三角測量します。当社のモデルでは、訪問頻度、期間、複数のコンピューターの使用の可能性、さらには同じコンピューターを使用して複数のユーザーが人に基づいた推定値を提供する可能性を考慮しています。ユニークCookieをユーザーに変換するためのモデルは、ホールドアウトサンプルと独立したデータセットを使用して検証されています。さらに、当社のモデルは動的であり、インターネットトラフィックパターンの進化する性質を反映するために継続的に再調整されます。


2
面白い。後者の抜粋は、最初のものよりも情報量が多く(説得力があります)。GAはファーストパーティCookieを使用するため、サードパーティCookieを考慮する必要はありません。はい、タイムゾーンの違いによって正確な数値が変更されますが、1か月以上のスパンでは、大きな測定値の違いを考慮することはほとんどありません。
ヤヘル

27

Quantcastの過少カウントには、別の要因があります。サードパーティCookie(.quantserve.comドメインから提供されるCookie )を使用しますが、GoogleアナリティクスはファーストパーティCookie(stackexchange.comなど)を使用します

一部のブラウザ(特にSafari、最近ではFirefoxおよびChrome)がデフォルト設定としてサードパーティのCookieを無効にし、他の多くのブラウザがサードパーティのCookieを禁止するプライバシー設定を個別に選択する場合があるため、これは非常に重要です。これは、QuantCastのCookieによって追跡されることのない母集団のサブセットがあることを意味します。本質的に、これはGoogle Analyticsが常により高い訪問者数を返すことを意味します。

経験則はないと思います。分析の実践者として、「真の」訪問者数の探求は絶望的であり、その代わりに訪問そのものに焦点を合わせていると思います。たとえば、あなたのGoogleアナリティクスアカウントには、少なくとも8人の訪問者がいて、職場のラップトップ、個人のラップトップ、電話、iPadでChrome、Safari、FirefoxからStackOverflowにアクセスしています。分析サービスはすべて異なる方法でカウントされるため、すべてが大幅に異なる数値を返します。

完全に実装されていても、Googleアナリティクスはほとんどの場合、サーバーログベースの分析システムよりも訪問数が少なくなりますが、QuantcastなどのサードパーティCookieベースのシステムよりも訪問数が多くなります。重要なことは、生の合計を見るのではなく、各方法がその強みで示す傾向です。したがって、Quantcastの数字をGoogleアナリティクスの数字と比較しないでください。代わりに、収集されたコンテキスト内の番号を使用します。

別の問題として、Googleアナリティクスの実装が正しくない可能性があります。複数ドメインおよびサブドメインのセットアップ用に構成すると、正しく厳密に行わないと悪夢になり、単一のブラウザが複数の訪問者、それ自体があなたの数を膨らませます。すべてのCookieはサードパーティのドメインで設定されるため、これはQuantcastの問題になることはありません。


Google ChromeはデフォルトでサードパーティのCookieもブロックしているようです。
MrWhite

7

ユニークビジターに対するCookieの比率は、通常、訪問数が100万を超えるサイトでは1.3〜1.7です。

yc01はGAがファーストパーティCookieとサードパーティCookieを使用することは正しいですが、RealSelf.comでは2つのファーストパーティアナリティクスプロバイダー(GAとComscore Direct)を使用しており、GAはComscoreのユニークビジターよりも30%多くの絶対ユニークビジターを示しています。

Comscoreは国別のユニークビジターのみを表示するため、GAとComscoreを比較するには、米国ベースの絶対ユニークビジターの数を次のように計算する必要があります。

米国訪問/グローバル訪問*絶対ユニークユーザー

(1,150,110 / 1,650,979)* 1,273,059 = 886,842米国ベースのユニークユーザー

対照的に、Comscoreは680,900の米国ベースのユニークユーザーを報告しています。したがって、GAは30.2%増加しています。

Comscoreは正確さを目指してビジネスを構築していますが、GAは主にAdWordsとAdSenseを使用するサイトを追跡して最適化する無料の方法です。Comscoreにはトラフィックの推定に使用する人々のパネルがあり、そのパネルを使用して1人あたりのCookieの平均数を決定します。モバイルデバイスを使用する人が増えると(モバイルの使用率は15%)、一意のCookieが一意の人の数を誇張することになります。


「訪問者が100万を超えるサイトの場合、Cookieのユニークビジターに対する比率は通常1.3〜1.7です。」それはComscoreが公開した図ですか?
シアラン

これは驚くほど正確です。UserSessionいくつかのサイトでテーブル統計を実行しましたが、それらは2.0(スタックオーバーフロー)から1.46(webapps.se)の範囲で、他のすべてのものが間にあります。1.6は、技術中心のサイトの非常に健全なデフォルトのようです。
ジェフアトウッド

4

さまざまな市場向けの「Cookie Inflation Multipliers」を使用したMediaMindの最近の(2011年5月4日-私がこれを書いている昨日)研究は次のとおりです。

計算されたインフレ率は、ドイツの2.2から米国の3.0までです。


これは素晴らしいです-まさに私が探していた種類の参照
ジェフアトウッド

2

GAの訪問者数は通常のサイトよりも膨らんでいるのかもしれません。それは、聴衆の技術的な性質のためです。たとえば、プログラマー、特にWeb開発者は、さまざまなブラウザーを使用しているため、Cookieの数が増えています。

質問1については、多くのメトリックと同様に、集計は誤解を招く可能性があるため、グローバルな標準を探すのではなく、独自のサイトのデータを使用する方が良いと思います。実際の訪問者数にCookieを取得する1つの方法は、各登録ユーザーから表示されるCookieの数をカウントし、そこから数を導出することです。

第2に関しては、理論的には実際の訪問者をカウントする最良の方法は、全員に強制的にアカウントを登録させることです。それは明らかに良いアイデアではないので、正規化を見ることができます。たとえば、上記で提案した登録ユーザーメトリックの平均Cookieを使用して、GAが報告している訪問者番号に適用できます。


これは素晴らしい点です。スタックオーバーフローでは、現在531,484のセッションがあり、そのうち261,547が一意のユーザーを指しているため、基本的には1人のユーザーごとに2つのCookieです。
ジェフアトウッド

-1

私はIPが信頼できると思います...私がPythonでGAのような統計システムを作成するとき、私はこのような方法を使用します

  • Cookieをブラウザに送信し、すべてのエージェントデータをデータベースに取得します
  • 新しい訪問にCookieがある場合、新しい訪問ではない簡単な方法なので、新しい訪問ではないとして保存します(また、ユーザーが2時間後に訪問サイトを繰り返した場合、新しい訪問を見つけるための日付と遅延時間を割り当てました)
  • ユーザーIPとこのユーザーのIDとIPとCookieを保存します(Cookieにも保存します)
  • 新しいユーザーが来て、クッキーを持っていません...このIPは新しいですか?はい?新しいユーザーはユーザーエージェントとIPのみを取得しますか?このユーザーは何回来ますか?限界以上?本当に新しい訪問ではなく、このユーザーエージェントではないでしょうか?OKこれは新しい...:D

このメソッドには障害がありますが、悪くなく有効なデータに近い...(また、新しいユーザーを見つけるまでの遅延時間(2回の訪問間の遅延)とCookieを持たないユーザーの試行時間にも依存します)


5
これは、たとえば、NATの背後からStackOverflowにアクセスするさまざまな開発者がいる会社をどのように処理しますか?それらはすべて1人の訪問者としてカウントされますか?
Svish

3
このIPの側面には本当に欠陥があります。IPアドレスは一意の識別子ではありません。
ヤヘル

このための試行時間があります...エージェントなどをチェックし、100回以上IPを1つ追加できます... NATの背後にある実際のユーザーを見つけるための推奨方法
Mohammad Efazati
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.