SANチームに敵を立てずに、SQLサーバーが不適切に構成されたストレージに苦しんでいないことを自分とアプリケーション開発者に安心させるにはどうすればよいですか?perfmon統計を使用するだけですか?sqlioのような他のベンチマーク?
何らかのベンチマークを行う前に知っておくべき最初のことは、自分のワークロードを実行するために必要な許容範囲です。したがって、新しいシステムをチェックアウトする前に、自分のものをベンチマークしてください。こうすると、ピーク負荷(バックアップ?)中に最大56MB / sをプッシュしていることがわかった場合、SANに接続されたディスクアレイがシミュレートされたピーク負荷の下で110MB / sだけをプッシュすることがわかります。制限はI / Oチャネルにはならないことを保証します。
新しいディスクアレイをチェックアウトするとき、この種のパフォーマンステストを行いました。新しいアレイでは、ファイバーチャネル(SCSI)ドライブの代わりにSATAドライブが使用されたため、環境で動作することを確認する必要がありました。私は深く疑っていました。しかし、特徴付けを行った後、新しいシステムにはピーク時のI / Oオーバーヘッドが十分にあり、より信頼性の高いディスクで測定されたピークに対応できることがわかりました。びっくりしました。
これらのSANドライブにテストをロードすると、実際に稼働するときに表示されるものの信頼できる反復可能な測定値が本当に得られますか?(SANソフトウェアが異なる時点で異なる「動的に構成」する可能性があると仮定します。)
SAN接続のディスクアレイは共有されているため、パフォーマンスは1週間にわたって変動します。ピークI / O負荷がいつであるかがすでにわかっている場合は、ピークI / O負荷が発生する時間帯に一連の負荷テストを実行します。そうすることで、最も関心のある期間にどのようなI / Oオーバーヘッドが利用可能かをよりよく特徴付けることができます。ピーク時以外の負荷テストでは、「スナッピー」なものがどのようになるかを感じ取ることができます。真の境界チェックを提供します。
SANの一部(Exchangeサーバーなど)のヘビーIOは、SQLサーバーに影響しますか?(各サーバーに専用ディスクを提供していないと仮定しますが、そうではないと言われています)
Exchange LUNがSQL LUNとディスクを共有する場合、それらは完全に共有されます。XPではなくHP EVAを使用していますが、同じ「ディスクグループ」の用語を使用していると思います。同じディスクグループ内のLUNはディスクを共有するため、それらの物理デバイス上のI / Oを争います。ディスクグループに入れるディスクが多いほど、アレイがI / Oをジャグリングするために必要な余地が増えます。アレイ(少なくともEVAがこれを行い、より高価なXPも同じことを行うと推測します)は、論理LUNブロックを物理ディスク全体に非順次的に分散します。これにより、提案されていることを実行できます。これは、頻繁にアクセスされるブロックのグループを異なる物理デバイスに動的に分散して、並列性を高め、ディスクレベルでのI / O競合を減らします。
質問は、そのディスクグループが持っているI / Oバジェットの量と、それらのLUNを使用するアプリケーションがI / Oに対してオーバーサブスクライブされているかどうかです。これは、ストレージ管理者が追跡しなければならない質問です。ExchangeのピークI / O(おそらくバックアップ中)がSQLの負荷と一致せず、両方のシステムが共存できる可能性があります。
さまざまな機能の論理ドライブ(データvsログvs tempdb)に論理ドライブを分離することは、ここで役立ちますか SANはこれらの異なるIOアクティビティを認識し、それらを異なる方法で最適に構成しますか?
HPアレイの場合、異なるI / OパターンをLUNではなく異なるディスクグループに配置する必要があります。たとえば、データベースI / Oパターンは、Webサービスアクセスパターンと共存しないでください。異なるディスクグループ内にない限り、異なるLUNがパフォーマンスを著しく向上させることはありません。それらが同じディスクグループにある場合、唯一の本当の利点はオペレーティングシステムにあります。オペレーティングシステムはカーネルでI / Oスケジューリングを行い、ディスクサブシステムへの並列性を改善できます。とはいえ...
私の理解では、HPアレイはLUNのさまざまなアクセスパターンを認識していますが、実際の論理ブロックには細心の注意を払っています。ログを別のLUNに配置すると、その種のI / Oトラフィックを取得する論理ブロックに制限が課され、物理ディスク上の論理ブロックを正しくソートするタスクが容易になります。
私たちは今、ちょっとしたスペースクランチをしています。アプリケーションチームは、データアーカイブなどをトリミングするように言われます。スペースの問題により、SANチームは、サーバーのパフォーマンスに影響を与える可能性のある内部ストレージ(RAIDレベルなど)の構成方法について異なる決定を下しますか?
間違いなく。スペースが限られている場合、I / O専用のディスクグループを取得しません(ストレージ環境が7TBの物理ディスクを排他的に使用するのに十分な大きさでない限り、その時点でそうなる可能性があります) )。Raid5 / Raid10の議論は、組織のポリシーに大きく依存しており、質問が最善の策です。