ある特定の町からの直接交通の急増


9

先月、直帰率も大幅に上昇しているのに、サイトへの直接訪問が150%近く増加していることに気付きました。

さらに掘り下げてみると、直行率100%で、コネチカット州のスタンフォードと呼ばれる1つの町から約2000件の直接訪問があったことがわかります。

私は答えを探し回っていますが、それは私たちの稼働時間監視ツールに関係している可能性があることしかわかりません。Pingdom。

誰かがこの種の問題について知っている/経験を持っていますか、どんな助けでもありがたいです

  • イギリスの町とスコットランドの町で同じトラフィックを受信して​​いることに気づきました...これは間違いなく私たちの稼働時間監視ツールと関係があると思います。


疑わしい。スタンフォード、エディンバラ、サウスエンドオンシーからの訪問数はほぼ2000回で、いずれも直帰率は100%です。また、直帰を正当化する可能性のあるブログ記事/回答とは対照的に、訪問は当社のホームページにアクセスします。
ダブルクリック

あなたはウェブサイトの名前を開示しても構わないと思いますか?アイデアはありますが、その情報を知る必要があります。言いたくないのであれば、ccTLDでさえも、ドメイン名だけです。
エリーケッセルマン

こんにちは、ここに私のWebサイトへの少しリンクがあります(検索の理由でドメインを貼り付けたくない!)bit.ly/WIHw2G
ダブルクリック

ジャックボットのフィルタリングについて議論しているサイトへのリンクを含む回答を投稿しました。
Anagio

回答:


11

人間の訪問者によるものではないように見える、ローカライズされた奇妙なトラフィックスパイクの原因を特定するには、忍耐と捜査が必要ですが、基本的な手順は次のとおりです。

  1. 利用可能なツールを使用して、それがどこから来ているのかを調べてください(以下を参照)。

  2. リクエストのソース、頻度、リクエストヘッダー自体、およびネットワークとサーバーへの影響を分析して、危険かどうかを判断します。

  3. (Google Analyticsフィルターを使用して)統計に表示されないようにするためだけにGoogle Analyticsでそれをブロックするかどうか、サーバーでブロックして将来サイトに到達しないようにするために(ファイアウォールまたは次のようなサービスを使用して)Cloudflare)、または完全に無視します。

ここでは、分析データに対する影響について心配しているように見えるため、ここではセキュリティの影響については詳しく説明しません。この特定のケースに関するいくつかの観察結果を以下に示します。可能なソースを特定し、Googleアナリティクスで不要なトラフィックを除外するためのいくつかの指針があります。

おそらくPingdomではない

Googleアナリティクスの急上昇がPingdomからのアクセスである可能性は2つの理由によります。

  • PingdomのHTTPチェックはJavaScriptを解析しないため、埋め込まれたGoogleアナリティクススクリプトはトリガーされません。(私は昨日、Pingdomのサポートチームとこれを再確認しました。私もPingdomを使用していて興味があったためです。サポートメールからの直接の引用は次のとおりです。「HTTPチェックではJavaScriptコードが実行されないため、Googleアナリティクスには当社のプローブサーバーがお客様のウェブサイトに行った訪問の記録。」

  • Pingdomは現在、エジンバラにサーバーを持っていません。コントロールパネルのページ(ログインすると、すべてのPingdom管理ページの右下にある「プローブサーバー」という名前のリンク)に、IPアドレスと場所とともにすべてのプローブサーバーが一覧表示されます。現在英国でリストされている唯一の2つは、マンチェスターとロンドンです。

しかし、あなたは私の言葉を取る必要はありません。スパイクが継続していて、Pingdomが突然の訪問や直帰率のスパイクの原因ではないことを確認したい場合は、次のことができます。

  1. サイトへのPingdomリクエストを一時停止し、それらの領域からのヒットが消えるかどうかを確認します。(私はそれが違いを生まないと思います。)

    —または—

  2. でページを設定し、example.com/pingdom/any-url-you-likePingdomリクエストをホームページではなくそのページにポイントし、/pingdom/(a)そのページのAnalyticsトラッキングコードを削除するか、(b)フィルターを使用して、ページごとにトラッキングコードを削除できない場合(たとえば、すべてのページにコードを含むCMSを使用していて、この動作を変更するための十分なアクセス権がない場合)。

Googleアナリティクスでリクエストをフィルタリングする方法

これは、Pingdom JavaScriptを解析している疑いがある場合にのみ必要であり、JavaScriptを解析する兆候ありませんが、Pingdomからの訪問をこのように除外することは、自分を安心させるかどうかを確認する1つの方法です。これを行う方法を学習しておくと、将来必要な場合に他のタイプの訪問を除外できます。

  1. Google Analyticsにログインし、[管理]リンク(右上、[ヘルプ]の横)をクリックします。

  2. フィルタリングするプロファイルのドメイン名またはサイト名をクリックします。(例example.com

  3. 「フィルター」タブをクリックします。

  4. 「+新しいフィルタ」をクリックします。

  5. フィルターに名前を付け、「定義済みフィルター」を選択したままにします。

  6. ドロップダウンボックスから[除外...サブディレクトリへのトラフィック...と等しい]を選択します。

  7. /pingdom/[サブディレクトリ]フィールドに入力し、[大文字と小文字を区別]を[いいえ]のままにします。

これが完了すると、次のような結果になります。

Google AnalyticsでのPingdomのフィルタリング

これらの設定を保存してからexample.com/pingdom/any-page-or-url-that-exists、Pingdomチェックをに再度ポイントすると、Google AnalyticsはそのURLへの訪問をフィルタリングします。(Pingdomがもはやあなたのホームページを指していなくても、基本的なサーバー稼働時間レポートはこの方法で引き続き得られます。)

Pingdomでない場合、それらのヒットはどこから来ますか?

あなたはいくつかの方法で見つけることを試みることができます:

1.最もバウンスされたトラフィックを送信しているネットワークを確認します。Google Analyticsでこれを行うには、サイトの[Standard Reporting]セクションを確認し、左側から[Audience]> [Technology]> [Network]を選択します。最後に、円グラフモードを選択して(デフォルト)、右側のドロップダウンから[合計への寄与...バウンス]を選択します。

合計バウンス

直帰率にユーザーが貢献したISPまたはネットワークプロバイダーのリストが表示されます。場合によっては、これは1つのエリアまたはビジネスまでたどることができる小さな特定のISPになります。バウンスするトラフィックを送信するネットワークプロバイダーの名前を利用して、上記のようにGoogleアナリティクスから特定のネットワークをフィルタリングすることを選択できますが、サブドメインではなくネットワークでフィルタリングします。

また、リストにある上位のISPは、数百万の顧客を抱える大規模な国内プロバイダーになり、賢くはありません。その時点では、Googleアナリティクスでは、そのプロバイダーの顧客のうち、バウンスされたトラフィックが繰り返し送信されているのをドリルダウンして特定することはできません(アナリティクスにはIPアドレス情報やその他の識別データが含まれていないため)。この種のデータを取得するには、IPアドレスを記録する別の統計プロバイダー(Clickyなど)を使用するか、サーバーログを分析してIPアドレスごとにアクセスを記録することができます。

2. Webサーバーのアクセスログを調べて、既知のクローラーからのアクセスを調査し、同じIPアドレスからの繰り返しアクセスを探します。AWStatsなどのWebベースの統計ツールがこれを支援します。特定のWebホストの間で非常に人気があり、すでにインストールされている場合があります。

ここではいくつかありますAWStatsの出力例を。「ホスト」と「ロボット/スパイダーの訪問者」の2つの関連セクションがあります。

ホストセクションでは、どのIPアドレスがサイトにアクセスしてバウンスを引き起こしているかの手がかりが得られる場合があります(これらのIPアドレスをGoogleアナリティクスで除外できます)。robots / spiderセクションは、JavaScriptを使用している可能性がある、サイトにアクセスしているクローラーまたは自動化スクリプトについてのヒントを提供する場合があります。サーバーログの読み取り方法やアクセス方法がわからない場合は、ホスティングプロバイダーにお問い合わせください。

IPアドレスをお持ちですか?誰がそれを使っているか調べてください。

AWStatsなどのHostsセクションからIPアドレスを取得できた場合は、逆IPルックアップを実行して、誰がそのIPアドレスを使用しているかを特定できます。

逆IPルックアップでは、リクエストが悪意があると思われる場合に悪用を報告できるホスティングプロバイダーの名前がよく示されます。または、顧客がWebサイトを悪用するためにスクリプトオートメーションを使用している国内のISPの名前がわかる場合もあります。あなたは、通常の虐待レポートを送信することができますabuse@example.com場合は、example.comホスティングプロバイダやISPの名前です。また、場合によっては、詳細について問い合わせることができる特定の会社の名前が表示されます。


現在、一部のPingdomサービスはJavaScriptを実行しています。詳細と回避策については、ヘルプサイトを参照してください。help.pingdom.com/ hc / en
Justin

1

Pingdomかどうかは、Pingdomサービスに設定した設定によって異なります。

httpリクエストを行うように設定されている場合、はい、おそらくPingdomです。http要求を使用していない場合(pingまたは他のサービスのみ)はPingdomではありませんが、http要求を使用していると想定します。

私はpingdomを使用しないので、テストの頻度を制御できるかどうかはわかりません。その後、できれば素晴らしいです。そうでない場合は、pingテストのみを使用するように切り替えることはできますが、Webサイトが稼働していることは保証されません。サーバーが稼働していることだけが保証されます。

Pingdomのテストの頻度を下げることができず、Pingdomが生成するトラフィックの量に問題がある場合は、それを破棄する必要があります。ただし、1か月に2000件のリクエストがあったとしても、それほど大きな問題にはならないでしょう。Webサイトの分析情報を台無しにしてしまうだけです。

Pingdomリクエストを分離してパターンを探すことで、これを回避することができます。次に、カスタム分析スクリプトがある場合は、パターンを検出し、パターンに準拠しているIPアドレスを分析結果から削除できます。ただし、これは面倒な価値がないと判断し、Pingdomによって毎月生成される誤ったヒットの量を覚えておいてください。

これがお役に立てば幸いです。


おかげで、私はPingdomと話をしました、そして彼らはそれが彼らと関係がないと信じています。IPに基づいて会社名を計算するleadforensicsと呼ばれる別の追跡ソフトウェアがあり、それはNCCグループ(nccgroup.com)と呼ばれる会社だと思われるようです。これについては現在、技術部門と話し合っています。
ダブルクリック

1

ウェブサイトPingdomへのボットトラフィックを識別して除外する方法に関する優れた記事がここに含まれていますhttp://www.blastam.com/blog/index.php/2012/06/block-web-monitoring-bots-in -google-analytics /長すぎてここにコピーできません

Keynoteなどのサービスを使用してWebサイトのパフォーマンスを監視している場合、それがWebメトリックに影響を与えることをご存知ですか?Keynote、Gomez、AlertSite、Pingdomなどのサービスは、実際のWebブラウザーを使用して、ロード時間のパフォーマンスを測定するために1日中繰り返しサイトにアクセスします。彼らは、Google AnalyticsトラッキングJavaScriptを実行する実際のブラウザーを使用して、世界中の複数の場所からサイトをロードしています。


1

それはおそらくNCCグループとしても知られるサイトの信頼です。

私たちのサイトでは、GAフィルターによる少しの調査により、エジンバラとスタンフォードからのすべてのミステリーヒットがWindows 7、IE8を搭載したPCからのものであるが、800x600の解像度で、多少怪しげに見えました。

IE 8でのヒットがないかログを確認したところ、5分ごとにヒットのパターンがすぐに見つかりました。これらのIPのDNSを逆にし、それらはサイトの信頼からのものです。


-2

これはおそらく言うまでもありませんが、検出されない自動化されたアクティビティである可能性が高いです。これを大きく歪曲するアクティビティ(直帰率100%)は、GAのボットフィルターを何らかの形で通過したボットの動作である可能性が非常に高いです。

可能であれば、これらの訪問をブラウザ/エージェント別にスライスします。それらがすべて単一のエージェントである場合(私は推測します)、自動化されたアクティビティの確率を強化します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.