2サーバーHAクラスターで奇妙な動作に気づいたので、誰かが私の疑いを確認できるか、または他の説明を提供できると期待していました...ここに私のセットアップがあります。
- 2サーバーのSQL 2012 SP1インストール
- いくつかのデータベースでSQL AlwaysOn HAが有効になっています
- CPUは2.4GHz、4コア
- RAMは34 GB(AWSインスタンスであるため、奇数)
- リソース使用率は比較的低く、各サーバーには14 GB以上の空きメモリがあり、SQLは使用するメモリ量に制限がありません
- ディスクアクセス時間は問題ありません-15ms / ReadまたはWriteを超えることはほとんどありません
- データベースは大きくありません-1 GB、1.5 GB、7.5 GB
- SQLサーバープロセスは16 GBのプライベートバイト、15 GBのワーキングセットを使用しています
全体的に、リソースの問題は指摘されていません。奇妙な部分です。SQLは再起動されません(プロセスはほぼ6か月間実行されています)が、〜50日ごとに、Page Life Expectancyカウンターが(ほぼ)0に低下しているようです。perfグラフは次のとおりです。
カウンターデータを見ると(正確な数はなく、1時間ごとの集計)、PLEカウンター値は毎回(少なくともデータがあるたびに)約4,295,000秒(約50日間)に達したようです。
私のクレイジーな理論は、PLE番号が符号なしlong int(4,294,967,295の制限がある)としてミリ秒として保持され、49.71日で設計またはバグのためにリセットされるというものです。これにより、2つのサーバーの動作と、それらが持つ同一のパターンが説明されます。または、まったく異なるものになる可能性があり、私はまったく意味をなさない。:)
誰かがそのようなものを見たか、またはこの動作を説明できますか?
PS私はこの投稿を見ましたが、私の場合は少し違うようです。
PPSこれは再投稿です-私はもともとここに投稿しましたが、ここの聴衆はより適切であるとアドバイスされました。
ありがとう!