x4またはx8デバイスでRAS(信頼性、可用性、およびサービス)機能が必要であり、ニーズのトレードオフを理解している場合にのみ意味があります。詳細については、デルのホワイトペーパー「Dell™PowerEdge™Servers 2009-メモリ」で説明しています。
また、R710に固有の詳細な構成とレイアウトは、PowerEdge R710のテクニカルガイドブックで入手できます(リンクについて評判がないため、これはGoogleです)。
注意すべき重要な問題は、チップ上のECCとシングルデバイスデータ修正(SDDC)用にDellのBIOSが提供する「アドバンストECC」の違いです。両方にパフォーマンスの影響があります。ECCは、チップへの書き込み中にエラーから回復します。ただし、SDDCはさらに一歩進んで、ビットを整理し、チップ全体が故障しても回復できるようにします。SDDC E7500チップセットの例を参照してください
問題は、マシンの特定の使用において、パフォーマンスや信頼性が最大の懸念事項であるかどうかです。チップの故障によりこのマシンで重要なデータまたは使用が失われ、実装で非冗長である場合、アドバンストECCは最適な方法です。ただし、パフォーマンスへの影響が大きい場合は、より重要になる可能性があります。
単一のMicrosoft SQL Serverを実装するために、Dell PowerEdgeサーバーの両方のフィールドに実装しました。さらにサポートが必要な場合は、コメントしてお知らせください。
お役に立てば幸いです。
編集:カバレッジギャップ/ ECC実装
はい、両方を実装してもカバレッジギャップがあります。特に、高可用性サーバーのクラスターを使用しているため、IMHOではアドバンストECCを使用する必要があります。クラスター化されたデバイスの利点と比較して、パフォーマンスへの影響は最小限です。Crucialによると、一般的にECCメモリのパフォーマンスは2%しか低下しません。
ギャップは、発生するエラーのタイプと、それぞれがエラーを処理する方法により固有です。あなたの特定の状況では、それはデータ損失に変換されるべきではありません。これはエンタープライズDBMSであるため、データの損失を防ぐために、ソフトウェアレベルでエラー、同時実行の問題などが管理されます。適切に構成されたDBMSの変更の詳細な履歴が保持され、それを使用するソフトウェアは通常、重大なエラーが発生した場合にトランザクションを「ロールバック」するようにセットアップできます。
ECCの実装
ECCは、メモリの読み取り/書き込みのビットエラーを修正しようとします。ただし、エラーがより重大な場合、ECCでさえ回復できず、データが失われる可能性があります。ECCのより多くの議論がで同様にありServerFaultの/何のECCラムは、なぜそれが良いですか?
ECC_Memoryのウィキペディアによると
ECCメモリは、シングルビットエラーのないメモリシステムを効果的に維持します...
SDDC
上記のE7500チップセットドキュメントを参照する場合(Intelの55xx / 56xxにはログイン/パートナーシップが必要ですが、アイデアは似ているため、元々リンクしていませんでした)、SDDCとその方法について説明しています。基本的に、メモリに書き込まれた単語を整理する手法を使用して、すべての単語が単一ビットエラーのみを含むようにすべてが書き込まれることを保証します。つまり、単語は単一ビットエラーから回復可能です(上記)。 これはワード単位であるため、各ワードをエラー修正することにより、x4デバイスでは最大4ビットエラー(ワードごとに1)、x8デバイスでは最大8ビットエラー(ワードごとに1)から回復できる可能性があります。
追加のエラー、より多くのビットエラー、合計メモリ障害、チャネル障害、バス障害などはすべて依然として恐ろしい問題を引き起こす可能性がありますが、それがクラスターとエンタープライズDBMSを持っている理由です。
要するに、すべてを有効にしていて、エラー修正アルゴリズムで修正するにはビットエラーが多すぎる場合、エラー、つまりエラーカバレッジギャップが残っています。ただし、これらは非常にまれです。