人間の訪問者によるものではないように見える、ローカライズされた奇妙なトラフィックスパイクの原因を特定するには、忍耐と捜査が必要ですが、基本的な手順は次のとおりです。
利用可能なツールを使用して、それがどこから来ているのかを調べてください(以下を参照)。
リクエストのソース、頻度、リクエストヘッダー自体、およびネットワークとサーバーへの影響を分析して、危険かどうかを判断します。
(Google Analyticsフィルターを使用して)統計に表示されないようにするためだけにGoogle Analyticsでそれをブロックするかどうか、サーバーでブロックして将来サイトに到達しないようにするために(ファイアウォールまたは次のようなサービスを使用して)Cloudflare)、または完全に無視します。
ここでは、分析データに対する影響について心配しているように見えるため、ここではセキュリティの影響については詳しく説明しません。この特定のケースに関するいくつかの観察結果を以下に示します。可能なソースを特定し、Googleアナリティクスで不要なトラフィックを除外するためのいくつかの指針があります。
おそらくPingdomではない
Googleアナリティクスの急上昇がPingdomからのアクセスである可能性は2つの理由によります。
PingdomのHTTPチェックはJavaScriptを解析しないため、埋め込まれたGoogleアナリティクススクリプトはトリガーされません。(私は昨日、Pingdomのサポートチームとこれを再確認しました。私もPingdomを使用していて興味があったためです。サポートメールからの直接の引用は次のとおりです。「HTTPチェックではJavaScriptコードが実行されないため、Googleアナリティクスには当社のプローブサーバーがお客様のウェブサイトに行った訪問の記録。」)
Pingdomは現在、エジンバラにサーバーを持っていません。コントロールパネルのページ(ログインすると、すべてのPingdom管理ページの右下にある「プローブサーバー」という名前のリンク)に、IPアドレスと場所とともにすべてのプローブサーバーが一覧表示されます。現在英国でリストされている唯一の2つは、マンチェスターとロンドンです。
しかし、あなたは私の言葉を取る必要はありません。スパイクが継続していて、Pingdomが突然の訪問や直帰率のスパイクの原因ではないことを確認したい場合は、次のことができます。
サイトへのPingdomリクエストを一時停止し、それらの領域からのヒットが消えるかどうかを確認します。(私はそれが違いを生まないと思います。)
—または—
でページを設定し、example.com/pingdom/any-url-you-like
Pingdomリクエストをホームページではなくそのページにポイントし、/pingdom/
(a)そのページのAnalyticsトラッキングコードを削除するか、(b)フィルターを使用して、ページごとにトラッキングコードを削除できない場合(たとえば、すべてのページにコードを含むCMSを使用していて、この動作を変更するための十分なアクセス権がない場合)。
Googleアナリティクスでリクエストをフィルタリングする方法
これは、Pingdom が JavaScriptを解析している疑いがある場合にのみ必要であり、JavaScriptを解析する兆候はありませんが、Pingdomからの訪問をこのように除外することは、自分を安心させるかどうかを確認する1つの方法です。これを行う方法を学習しておくと、将来必要な場合に他のタイプの訪問を除外できます。
Google Analyticsにログインし、[管理]リンク(右上、[ヘルプ]の横)をクリックします。
フィルタリングするプロファイルのドメイン名またはサイト名をクリックします。(例example.com
)
「フィルター」タブをクリックします。
「+新しいフィルタ」をクリックします。
フィルターに名前を付け、「定義済みフィルター」を選択したままにします。
ドロップダウンボックスから[除外...サブディレクトリへのトラフィック...と等しい]を選択します。
/pingdom/
[サブディレクトリ]フィールドに入力し、[大文字と小文字を区別]を[いいえ]のままにします。
これが完了すると、次のような結果になります。
これらの設定を保存してからexample.com/pingdom/any-page-or-url-that-exists
、Pingdomチェックをに再度ポイントすると、Google AnalyticsはそのURLへの訪問をフィルタリングします。(Pingdomがもはやあなたのホームページを指していなくても、基本的なサーバー稼働時間レポートはこの方法で引き続き得られます。)
Pingdomでない場合、それらのヒットはどこから来ますか?
あなたはいくつかの方法で見つけることを試みることができます:
1.最もバウンスされたトラフィックを送信しているネットワークを確認します。Google Analyticsでこれを行うには、サイトの[Standard Reporting]セクションを確認し、左側から[Audience]> [Technology]> [Network]を選択します。最後に、円グラフモードを選択して(デフォルト)、右側のドロップダウンから[合計への寄与...バウンス]を選択します。
直帰率にユーザーが貢献したISPまたはネットワークプロバイダーのリストが表示されます。場合によっては、これは1つのエリアまたはビジネスまでたどることができる小さな特定のISPになります。バウンスするトラフィックを送信するネットワークプロバイダーの名前を利用して、上記のようにGoogleアナリティクスから特定のネットワークをフィルタリングすることを選択できますが、サブドメインではなくネットワークでフィルタリングします。
また、リストにある上位のISPは、数百万の顧客を抱える大規模な国内プロバイダーになり、賢くはありません。その時点では、Googleアナリティクスでは、そのプロバイダーの顧客のうち、バウンスされたトラフィックが繰り返し送信されているのをドリルダウンして特定することはできません(アナリティクスにはIPアドレス情報やその他の識別データが含まれていないため)。この種のデータを取得するには、IPアドレスを記録する別の統計プロバイダー(Clickyなど)を使用するか、サーバーログを分析してIPアドレスごとにアクセスを記録することができます。
2. Webサーバーのアクセスログを調べて、既知のクローラーからのアクセスを調査し、同じIPアドレスからの繰り返しアクセスを探します。AWStatsなどのWebベースの統計ツールがこれを支援します。特定のWebホストの間で非常に人気があり、すでにインストールされている場合があります。
ここではいくつかありますAWStatsの出力例を。「ホスト」と「ロボット/スパイダーの訪問者」の2つの関連セクションがあります。
ホストセクションでは、どのIPアドレスがサイトにアクセスしてバウンスを引き起こしているかの手がかりが得られる場合があります(これらのIPアドレスをGoogleアナリティクスで除外できます)。robots / spiderセクションは、JavaScriptを使用している可能性がある、サイトにアクセスしているクローラーまたは自動化スクリプトについてのヒントを提供する場合があります。サーバーログの読み取り方法やアクセス方法がわからない場合は、ホスティングプロバイダーにお問い合わせください。
IPアドレスをお持ちですか?誰がそれを使っているか調べてください。
AWStatsなどのHostsセクションからIPアドレスを取得できた場合は、逆IPルックアップを実行して、誰がそのIPアドレスを使用しているかを特定できます。
逆IPルックアップでは、リクエストが悪意があると思われる場合に悪用を報告できるホスティングプロバイダーの名前がよく示されます。または、顧客がWebサイトを悪用するためにスクリプトオートメーションを使用している国内のISPの名前がわかる場合もあります。あなたは、通常の虐待レポートを送信することができますabuse@example.com
場合は、example.com
ホスティングプロバイダやISPの名前です。また、場合によっては、詳細について問い合わせることができる特定の会社の名前が表示されます。