デスクトップPCでECC RAMを使用することには、特定の、または測定可能な利点がありますか?


21

クラッシュ、リブート、おかしな動作などが絶対に嫌いという点で、安定したマシンの構築に大騒ぎしているため、エラー訂正(別名ECC RAM)は大きな問題を解決するようです:メモリエラー。

しかし、それは本当に機能しますか?クラッシュやその他の動作が少ないなど、測定可能な利点はありますか?

コストとは別に、新しいPCビルドにECCメモリを使用してみませんか?なぜECC機能は主にサーバー/ワークステーションクラスのマシンで利用可能でサポートされていますが、消費者向けのマザーボードではサポートされていないのですか?


1
はい、ECCはソフトエラーに対して非常に役立ちます。エラーがメモリアクセスにある場合、ソフトエラーはシステムをクラッシュさせる可能性があります。単一のソフトエラーが10億ドルの産業を停止させたと報告されています。これについての詳細なリファレンスを次に示します。
user984260

回答:


10

私は数年前からサーバーでECCラムを使用しています。「1日12〜16時間以上使用している」など、マシンを頻繁に使用している場合、ECCは非常に優れています。私がECCなしで構築した小さなホワイトボックスサーバーは、遅かれ早かれ、再起動を必要とする「問題」を開発しましたが、ECCマシンにはこれがありませんでした。

だから私の答えは:お使いのコンピュータが使用している場合、多くの場合、最も可能性が高いそう。コンピューターを24時間365日使用する場合、必需品である必要があります。

ECCをサポートするマザーボードがいくつかあります。それらは通常、物事の「より高い」端にありますが、少しの研究で、あなたは様々なメーカーからそれらを見つけることができます。他の唯一の考慮事項は、BIOSでECCサポートを有効にすることを忘れないことです。


Googleはこの問題をめぐって出てきました。これが実際に現代のシステムにどのように影響するか については、http://blogs.zdnet.com/storage/?p = 638を参照してください。


8
「私は、ECCなしで構築したサーバが持っているホワイトボックスリトル再起動が必要な、遅かれ早かれ、開発『問題』」 -これが私の好みのためのコンピューティングビット作り話/ブードゥー教..です
ジェフ・アトウッド

4
そして、あなたは私がそれに気づいていないと思う?他にどのようにあなたは説明することができ、同じ上のソフトウェアと同じ奇妙な問題を(メールが誤配信される)を有するハードウェアを、しかし、問題は自動的に解決した後、あなたはすべてのRAMを置き換えますか?私はどちらかのアイデア好きではないが、問題がでていることだけで大きな変化にコンポーネント、および夫婦だったことを考えると消える ... ECCのアップグレード後も、それは無視するのは難しい
エイブリー・ペイン

1
言及するのも忘れていました-RAMはECCアップグレードの前に一度交換され、問題は続きました。たぶん、それはモボの悪い痕跡でした。ボードの設計上の欠陥だったのかもしれません。後から考えると、他の多くの問題があった可能性がありますが、それぞれがEEを出してスコープでプローブする必要がありますが、一日の終わりに、ECCは他の理由がない限り問題を解消しましたRAMからフェッチされたデータが100%一貫した状態であることを確認してください。ジェフ、私はそれがブードゥー教であることに同意します...私はそれが好きではありませんが、それはあります。
エイブリーペイン

1
@ジェフ・アトウッド-まあ...結局のところ、これはブードゥー教でした、あなたのコンピューターにこれが起こっていないという意味で... 結局のところ、cs.toronto.edu /〜bianca / papers / sigmetrics09.pdf
Averyペイン

6

サーバーが必要とする場合にのみECCを使用する価値があると思います。ウィキペディア

コンピュータシステムのエラー検出と修正は、時代遅れになっているようです。Seymour Crayは、CDC 6600からこれを除外した理由を尋ねられたとき、「パリティは農家のためです」と有名でした。CDC7600にパリティを含め、「多くの農家がコンピュータを購入することを知った」と言われました。

ギガバイトあたり月に1ビットのエラーがあるという漠然とした主張以外、インターネット上で決定的なソースを見つけることはできません。リモートでこれが当てはまる場合、サーバーは世界中で左右にクラッシュします。

実際のサーバー管理者のMetaFilterスレッドのいくつかのハイライト:

ECCはクールなものだと思いますが、サーバーの有無に関係なくサーバーを使用しました。

ECC RAMの目的は理解していますが、ポイントは理解していません。つまり、宇宙線のビット反転に起因する問題に気付いたことは一度もありません。複数年のアップタイムがあるパーソナルコンピューティング/コンパイルサーバー上でも。ビットが反転しなかったと言うわけではありませんが、それらは確かに重要ではありませんでした。

数千台のマシンのファームをあちこちで実行している私の経験では、ECC修正可能な問題を抱えているよりも、Ext3を静かに吐き出している可能性が高くなります。

個人的には、ECCは少々貨物カルティッシュだと思いますが、コストプレミアムが高すぎない限り、大型の大型サーバーでの合理的な保険ポリシーです。


左右にクラッシュしますか?そんなに悪いとは思わない。興味深い再:「左右のクラッシュ」...ただし、ビットエラーは未割り当てのRAM(ロット、十分に活用されていないサーバー上)、または割り当てられたメモリで解放または再割り当てされる前に実行または参照されない可能性があります。デッドコードに少しエラーがある場合、それは音を出しますか?)
クリスW. Rea

また、Googleにはメモリエラーについて何か言いたいことがあるのでしょうか。サーバーのトンを実行します。私は...とは反対に、言う、フリッツの電源をエラーをRAMに起因だろうどのくらいのサーバーダウンタイム不思議
クリス・W.レア

3

重要なシステムの場合に考慮しました。1つの問題は、メモリ整合性チェックの実行に使用されるプログラム自体がメモリエラーになりやすい場合に、ソフトウェアでエラー検出を実行してメモリ整合性を確認する方法です。基本的に不可能であり、故障モードの分析/故障の軽減が困難になるため、ECCは軽減メカニズムです。

これは、問題がある場合に実際に宇宙線を責めることができるケースの1つです;)


2

「ミッションクリティカル」アプリケーションにはECCラムを検討します。サーバーエラーが原因で多額のお金を失う(または人を殺すなど)場合は、ECCラムを使用してください。基本的に、ECCラムのコストと、エラーが発生した場合に失う可能性のあるコストを比較検討します。

しかし、あなたが何を決めようとも、私はMemTest86 +を一晩実行することをお勧めします(または、アドレス空間全体で数回パスするのに十分な時間)。そして、(文字通り)熱を上げることができれば、システムが熱くなっているときにラムがどのように動作するかを知ることができます。

MemTestで最新のRAM展示エラーが発生しました。また、MemTestが検出した "良い"ラム開発エラーも時間の経過とともにありました。これは素晴らしいツールであり、新しいシステムで最初に実行するものの1つです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.