HDDバックアップではどのような定期メンテナンスを行う必要がありますか?


15

SSD、磁気ディスクではなく、外付けHDDに多数のディレクトリをバックアップしています。

バックアップは1つのディスクにのみ保存されます(はい、コピーを備えた追加のHDDを使用することをお勧めしますが、現時点ではそうではありません)。また、ディスク上のファイルの二重コピーはありません。

HDDには(オプション1)ファイルが占有するスペースよりもはるかに多くのスペースがあります(オプション2)ファイルが占有するスペースよりも少ない空きスペースがあります(しかし、それでもかなりの量です)

ディスクを元のパッケージに保管します。プラスチックの袋は、ラッピングのような「卵箱」の中に、プラスチックの箱の中に入れます。私の家の部屋に保管されており、箱は太陽や雨などにさらされません。

私の質問は、データの寿命を最大化するために、定期的にディスクを使用する必要があるかどうかです。たとえば、すべてを他の場所に読み込んだり、読み書きを行ったり、ディスク上のデータの物理的位置を何らかの方法でシャッフルしたり、ディスクを揺らしたり、物理的位置を変更したり、何もせずに電源を入れたりするなど。説明した両方のオプションシナリオに対する回答をお願いします。

ノート:

  • この質問を特定のHDDブランドに限定するのではなく、東芝STOR.Eの基本750 GBドライブです。私の選択ではなく、これで作業する必要があります。
  • HDDのマニュアルには、この問題について何も記載されていません。
  • バックアップは、過去のある時点でこれらのフォルダーの状態を表します。この状態をそのまま維持することが重要であり、同じデータの「マスターコピー」がないことを前提としています。
  • おそらく質問とは無関係ですが、これらのファイルが失われても壊滅的に悪くはありません。予想される寿命を延ばしたいと思います。
  • 2台のHDDに2つのコピーがあったとしても、質問は同じように関連性があります。それぞれについて個別にどのようなメンテナンス操作を行う必要がありますか。

データを表す磁場を「改善」するために定期的にファイルを読み取ることは良い考えです。これに自動化/追加の保護を追加するファイルシステムを使用すると、少し簡単になります。明らかに、同じデータを持つ複数のメディアデバイスを持つことが望ましいでしょう。HDDをオフラインストレージとして使用するのは珍しいシナリオであるため、このマニュアルではこのことについて何も言及していません(推測)。
セス

4
答えは意見と一般的な慣習に基づいているようです。しっかりした、研究に基づいた答えや信頼できる引用は見ていません。
fixer1234

SUで質問と回答がありましたが、それはあなたのQよりもずっと複雑です。このQの受け入れられた答えを読んでください。期待できるすべてのデータ/ソース/引用!彼のデータから何が効果的かを抽出できます。
ジプシースペルウィーバー

回答:


5

プロの観点から、あなたのオプションは次のとおりです。

  1. 祈る。
  2. 複数のデバイスで複数のコピーを作成します。

「オプション1」(より多くのスペース)では、同じハードウェアで複数のコピーを作成することにより、オッズを非常にわずかに増やすことができますが、実際には、ハードウェアが故障し、ディスク全体が読み取り不能になることはまれです。単一のコピーは実行可能なバックアップ戦略ではありません。

これが実際のバックアップ(プライマリデバイス上のファイルの)か、アーカイブ(プライマリデバイスから削除されたファイルの)かは不明です。バックアップの場合、理論的にはプライマリコピーが存在するため、完全に不運になる前に少なくとも2つの障害が発生する必要があります。


1
あなたの推奨事項は有効で高く評価されていますが、それは私が尋ねたものではありません。あなたは、私が提案したすべての行動が長寿に関して無意味/役に立たないことを暗示しているようです。それはあなたが言っていることですか?
アインポクルム

1
申し訳ありませんが、祈りは実際には「専門家」の観点からではありません。
oldmud0

2
あなたが優れたエンジニアであれば、マーフィーに祈ります。そして、あなたの供え物は、このデータのためのより多くの家で構成されます。他の神々や供物は満足のいく結果をもたらさないかもしれません
...-Ecnerwal

1
Tbh、単一のコピーで、神の恩恵を求めることは最悪の考えではありません。
ジャーニーマンオタク

5

あなたは持っている場合はより多くの空き領域のバックアップデータが使用するよりも、あなたの- オプション1問題のを-またはあなたがデータの複数のコピーを持っている場合、私は「何かをする」だろうという考えを持っています。SpinRiteがハードドライブの「メンテナンス」に本当に役立つと考えている場合、および/またはデータをすべて上書きしてから再書き込みしたい場合は、これで十分です。

あなたが何かをすべきかどうかにかかわらず、私はあまり確信がありません...ビット腐敗やデータ劣化が実際に存在するようであり、スーパーユーザーに関するこの質問とサーバーフォールトに関するこの質問は、バックアップまたはエラーを示唆しているようです-修正またはフォールトトレラントRAID(ただし、1台のハードドライブについてのみ、複数のバックアップとハッシュ/ CRCチェックを選択し、RAIDに障害が発生した場合の対処方法は気にしません)。

私はより単純で怠zyな「何もしない」アプローチに傾いていますが、少なくとも次の方法は少なくとも1年に1回は自分のデータを読み取れることを確認してください

一部のSpinRiteメンテナンス機能のLinux DIYエミュレーション

多くの人がSpinRiteが実際に機能すると確信しているようですが、無料ではないのでLinuxを実行しています。そのため、Steve GibsonのSpinRiteの動作を聞いたことがありますか?ビデオと彼は、SpinRiteが今やっていることの1つは次のようであると言っています。

  • ドライブ全体を読み取ります
  • ビットを反転して書き込みます
  • もう一度読む
  • ビットを反転して書き込みます
  • もう一度読む

ドライブが(軽微な)問題を検出した場合、これは「ドライブ自体が不良セクタを正常なセクタと交換するよう誘導する」必要があります。

どのくらいの頻度でこれを行う必要がありますか?スティーブは「誰もそれがどれくらいの頻度であるかを実際には誰も知らないが、数ヶ月ごとに十分であるはずだ」と言う。6か月ごと、または1年ごとに推測しています。

badblocks

読み取り/反転/読み取り/反転プロセスbadblocksは、書き込みモードテスト(-wオプション)を使用した場合とほぼ同じように聞こえますが、データを実際に「ビットフリップ」するのではなく、すべてのデータを破壊的に書き込み、読み取り、およびフリップしますパーティション上のビット:

このオプションを使用すると、badblocksは、デバイスのすべてのブロックにパターン(0xaa、0x55、0xff、0x00)を書き込み、すべてのブロックを読み取って内容を比較することにより、不良ブロックをスキャンします。

偶然ではありませんが、これらのパターンは2進数で10101010、01010101、11111111、00000000です。

そのため、badblocksはビットの書き込み、読み取り、反転をかなり徹底的に行い、しかも無料です。mke2fsbadblocks(を使用badblocks -cc)を実行している場合、badblocksのリストが保存されるため、ext2 / 3/4はそれらが見つかった場合はそれらを回避します。

欠点は、badblocksの書き込みテストが 破壊的であるため、これを機能させるには少なくとも2つのパーティションが必要です(データを保存して書き戻すため)。

  • データのコピーを2つずつハードドライブ保管し、それぞれ異なるパーティションに保管してください!
    これにより、1つのパーティションのすべてのビットを10、01、11、00で上書きできるため、不良領域が発生した場合の回復の可能性が2倍になります。また、CRC32やMD5などのデータファイルのチェックサム/ハッシュのリストを保持します(MD5 / SHAはCRCと比較して非常に低速であり、ランダムエラーはCRCで見逃してはなりません)
  • 数ヶ月ごと:
    1. バックアップコピーを読み、チェックサム/ハッシュと一致することを確認します。
    2. 「擬似」ビットフリップパーティションを持つbadblocks -wmke2fs -cc一つだけのパーティションは、ただ一つのコピー、すべてのデータを上書きしないでください!)
    3. 新しく反転したパーティションにデータをコピーして戻します
    4. 「擬似」-他のパーティション(まだ反転されていないパーティション)をビット反転します
    5. 新しく反転したパーティションにデータをコピーして戻します

これはデータの再フォーマットとコピーバックに似ていますが、クイック/標準形式では通常すべてのセクターに書き込みが行われないため、多くのビットを変更/反転しないことになります


最適なソリューションは、常に複数のデバイスに複数のコピーを作成することです
私は、光学メディアが10年、20年、おそらく50年以上も読み取り可能であり、2つの同一のディスク/ ISOが適合することを読みましたgddrescue(以下)。
多くの場合、クラウドストレージは数GBで無料であるため、特に量が増え続ける場合は、ファイルを(オプションで暗号化して)保存することをお勧めします。

また、エラー修正アーカイブにファイルを保存すると、エラーが発生した場合に役立ちますが、100万ファイルのうち1フ​​ァイルを失うことは、100万ファイルのアーカイブ全体を失うことほど悪くないかもしれません。ECC-CRCのような個別のエラー修正ソフトウェアが存在する場合、それは役立ちますが、私はそれを知りません、そしてデータの追加のコピーはさらに良いでしょう。


接線方向に関連して、SpinRiteは、ハードドライブの不良セクタからデータを「非常にハードに試行」し、さまざまな方向と速度からgddrescue読み取ります。これは、データの読み取りに問題が発生した場合(またはその場合) 。gddrescueは、エラーのあるデータの2つのコピーから読み取ることもでき、できれば1つの完全なコピーをつなぎ合わせるddことができます。同一のコピーを変更するため、それらを回避できませんでした。


あなたはの説明にリンクすることができ、正確にあなたがしてパーティションを-fligビットどのようにbadblocksmke2fs
アインポクルム

ビット反転は、セクター外にあるセクターアドレスを修正しません。SpinRiteは、ディスクコントローラーのいくつかのプロパティを、意外な方法で巧妙に使用しており、仕様から簡単に導き出せないことを知っています。HDD Regeneratorの背後にいる人はそれを解決したかもしれませんが、それは一般の知識ではありません。
harrymc

証拠ビット反転が何らかの効果があるか?私は見たことがないことを問題解決のためのディスクの摩耗を取引のように聞こえる任意の任意の適切な、信頼できるソースでは、どこでも、これまでの参照を。引用は非常に教育的です。
ジャーニーマンオタク

@einpoklum答えをいくつか更新しました。不良ブロックがすべてのビットを上書きしてからデータを書き戻すためマニュアルページ以外のリンクはありません。
Xen2050

@JourneymanGeek私は、スティーブギブソンが彼のサイトのリンクされたビデオで、基本的に「馬の口から」と言っていることだけを行っていました。しかし、残念ながら、少なくともクイック検索からは、他の参照がありませんでした。実際、他のSEの質問からは、ビットロートはそれほど心配する必要はないかもしれませんし、同じ場所にある同じビットであっても、書き直しだけで「物理ディスク表面の磁区[元の強さで更新される」
-Xen2050

5

ここのほとんどのポスターで見逃されているように見えるので、これはこの優れた投稿を使用して、あなたの質問の詳細への私のお勧めの答えです、どのメディアが長期、大容量、データストレージ(アーカイブ)に使用されるべきですか?ガイドとして。彼が素晴らしい仕事をしたので、私はそこから参考文献や研究を再引用するつもりはありません。そして、この記事の要約よりも投稿全体を読むほうが良いです。

コールドストレージの1台のHDD(オフライン)に制限します。2つのオプションを指定すると、ドライブを数年ごとに接続し、スピンアップする必要があります。これを行う最大の理由は、スピンドルグリースの硬化と焼き付きを防ぐためです。スピンドルグリース時間の経過とともに硬化し、ディスクを時々回転せると、その結果が大幅に遅れる可能性があります。HDDへのグリースの重要性についての洞察を得るために、ミネベアの努力量を見てください。HDDモーター製造業者は、このレポートでそれについての研究を行っています。

ディスクが接続されている間、いくつかのSMART診断を実行して、電子機器、ハードウェア、またはプラッターの差し迫った障害の兆候を探すこともできます。Googleカーネギーメロン大学が FAST'07で発表した調査(その年の「ベストペーパー」を受賞)から、SMARTテストは失敗を示すことができますが、「合格」テストは健康を示すものではない場合があります。それにも関わらず、チェックは害になりません。はい、それは古い研究ですが、誰もそれを新しいものに置き換えたようには見えません。

ドライブをしばらく実行し、データにアクセスすると、データを保持している磁場の強度も更新されます。事例証拠の大群に基づいてそれが必要ではないと主張する人もいますが、そこにある研究は磁場の弱体化が可能であることを示しているようです。ウィスコンシン大学マディソン校から、パリティ汚染データ破損ディスクポインター破損の 3つの論文を発表しました。これらを読んだ後、それらの結論があなたのデータをどれだけ脅かすか、そしてそれに対してどれだけの労力を保護する価値があるかを決めることができます。

推奨されるキュレーションルーチン

どのOSを使用しているか、どのツールを使用しているか、どのツールを選択しているのか、またどのファイルシステムを選択しているのかわかりません。したがって、私の提案は一般的なものに過ぎず、構成や設定に最適なツールを選択できます。

まず、ストレージのセットアップです。ファイルをHDDに保存する前に、それらのアーカイブを作成します。これは圧縮を意味するものでも、回避するものでもありません。エラー回復または「自己修復」機能を提供するアーカイブ形式を選択します。1つの大規模なアーカイブを作成するのではなく、一緒に属するものをアーカイブして、アーカイブのライブラリを作成します。圧縮を選択する場合は、エラー回復機能を妨げないようにしてください。ほとんどの音楽、ビデオ、映画、および画像形式では、圧縮を行う意味はありません。このようなファイル形式は既に圧縮されており、圧縮しようとしてもスペースを取得することはめったにありません。大きなファイル、および時間とCPUパワーをお買い得で無駄にします。それでも、上記のエラー回復のためにそれらをアーカイブします。次に、選択したダイジェストアルゴリズムを使用して、各アーカイブファイルのチェックサムを作成します。ここではセキュリティは問題ではなく、単にファイルの健全性チェックであるため、MD5で十分ですが、何でも機能します。アーカイブファイルでチェックサムのコピーを保存し、そして同じHDD上の2番目の場所-おそらくチェックサムの総コレクションのための専用ディレクトリ。これらはすべてディスクに保存されます。次に、非常に重要なのは、チェックサムの作成とアーカイブの復元に使用したツールをそのHDDに保存することです(圧縮を使用した場合は、それらも解凍します)。システムによっては、プログラム自体である場合もあれば、それらのインストーラーである必要がある場合もあります。これで、選択した方法でHDDを保存できます。

2番目はストレージです。現在のHDDは、物理的な衝撃(揺れや跳ねる衝撃)から合理的に保護されていますが、押しても意味がありません。質問で言及した方法で保存してください。電磁力の影響を受ける可能性が高いエリアを避けてみてください。たとえば、サーキットブレーカーパネルやHAM無線機と同じ場所ではありません。数マイル離れた場所に落雷することは避けることはできませんが、掃除機と電源は避けることができます。極端になりたい場合は、ファラデーシールドまたはファラデーバッグを入手してください。あなたの提案のうち2つは無意味であるか、悪いです。それが保存されている間、その物理的な位置を変更すると、その問題は何も影響しません、それが揺れでしたほとんどのドライブは優れたGショック保護を備えているため、損傷を引き起こすことはありませんが、可能です。

最後は定期的な対策です。たとえば、1年ごとまたは2年ごとに選択したスケジュールで、ストレージから削除し、コンピューターに再接続します。SMARTテストを実行し、実際に結果を読み取ります。SMARTの結果が「次回」ではなく「今回」と表示されたら、ディスクを交換する準備をしてください。接続されている間に、すべてのアーカイブファイルをチェックサムと照合します。チェックに失敗した場合は、アーカイブ形式のエラー回復機能を使用して、そのファイルを復元し、アーカイブとそのチェックサムを再作成して再保存してください。また、オプション2に「適切な量」の空き領域があると指定したため、アーカイブを新しいディレクトリにコピーしてから元のファイルを削除します。単に「移動」しても、まったく移動しない場合があります。多くの新しいファイルシステムでは、ファイルを移動すると、リストされているディレクトリが変更され、ただし、ファイルの内容は元の場所に残ります。ファイルをコピーすることにより、強制的に別の場所に書き込むことができ、元のファイルを削除してスペースを解放できます。多数のアーカイブファイルがある場合、HDDの空き領域を埋めるほど大きいものはほとんどありません。すべてのファイルを確認または復元し、選択したファイルを移動した後、パッケージを復元し、次回までストレージに戻します。

注目すべき追加事項。システムをアップグレードする場合、またはさらに悪いことに、別のOSに切り替える場合は、新しい構成でそのHDDを読み取ることができることを確認してください。プレーンテキストではないものがある場合は、保存されたファイルを読み取る機能を失わないようにしてください。たとえば、MS-Word文書では、1つの形式で作成された方程式を使用できますが、新しいバージョンではそれらを読み取ることができません。まさにその問題についてはこれを見てください。ただし、Wordだけが問題の原因ではありません。また、オープンソース形式でさえ、データの将来性を保証するものではありません。この分野の大失敗については、失敗したDigital Domesday Bookプロジェクトについて読んでください。。新しいテクノロジーが登場したら、コレクションの更新も検討してください。AVIファイルとして保存されたムービーがあり、MKVの方が好きな場合は、変換してください。ワープロ文書があり、プログラムをアップグレードする場合は、アーカイブされた文書を新しい形式で再保存します。


4

磁気メディアは時間の経過とともにフェードする可能性があり、結果は不良ビットまたはセクターになります。1つの解決策は、磁気部品を数年に1回更新することです。

最も簡単な方法は、ハードディスク全体をコピーして書き換えることです。ただし、セクタアドレスは更新されない場合があります。セクタアドレスは、ファームウェアがヘッドを位置決めできるセクタの「ヘッダ」です。セクタアドレスを更新するには、ディスクの再フォーマットが必要になる場合があります(ディープフォーマット-迅速ではありません)。

別の解決策は、ディスク再生成製品を使用することです。これらの製品は物理レベルでディスクをスキャンし、すべてのセクターとそのアドレスを読み取り、両方を書き換えて磁気データを更新します。

追加のボーナスは、読み取りエラーの場合、これらの製品はデータを保存するために複数の読み取り方法を試行し、セクターを不良としてマークし、スペアセクターにマッピングします(ほとんどのハードディスクにはスペアセクターがあります)データが保存されます。

以下にそのような製品をいくつか示します。

  • DiskFresh(プライベートおよび非営利使用または25ドル無料)-良い評価を得ているPuran Utilitiesの一部。破損/不良セクターがある場合にのみ通知し、高度な回復は行いません。

  • SpinRite(返金保証付き$ 89)-これは数年前から更新されていませんでしたが、数年前にディスクを保存していました。製品はかなり古いので、返金保証は信用しません。

  • HDD Regenerator(返金保証付き89.99ドル)-好評の新製品。

安全で長期的なストレージを探している読者のための完全性のために、私は、M-DISCまたはArchival Discとして商業的にブランド化された「一回限り読み取り可能な」DVDおよびBlu-Ray製品が存在することに注目します。


SpinRiteは独自のブータブルメディアを使用することを知っています。あなたが言及した他のものはどうですか?Windowsベースですか?Linuxベース?独自のブート可能ベース?
アインポクルム

1
DiskFreshはWindowsで実行され、HDD RegeneratorはWindowsと起動可能なフラッシュディスクの両方を実行します。
ハリーマック

そのため、Linuxでそれと同等のことを行うには別のブート可能/dev/sdXファイルが必要かどうか、またはデバイスファイルだけで間に合うかどうかなどを尋ねる必要がありますdd
アインポクルム

1
@einpoklum:ディープフォーマッティングとディスクイメージングと書き換えを行うオペレーティングシステム下の製品は、書き換え部分のddを含めてジョブを実行します。ポイントは、ファイルデータとメタデータの両方に使用されるディスクのすべてのセクターを完全に更新することです。ディスクをコピーする間、代替の一時ストレージが必要ですが、今日は安価です。
-harrymc

@einpoklum:メンテナンスにDiskFreshを使用し、より高度なユーティリティのみを使用してエラーから回復できます(成功は保証されません)。DiskFreshは、正しいストレージ条件の下で十分なはずです。
-harrymc

3

メンテナンスは一切実行しないでください。ドライブを再接続して電源を入れると、継続的に動作させるよりもリスクが高くなり、ボックスでスリープ状態にするよりもはるかに高くなります。したがって、非常に頻繁にチェックすると、実際に損傷の確率が高くなります。

保管方法は優れていますが、温度を忘れないでください。極端にさせないでください。バックアップドライブとして正確に何を使用していますか?いくつかは他のものよりずっと耐久性があります。

あなたができることは、あなたが述べたように十分なスペースがあるので、HDDに同じデータの2つのコピーを作成します。不良セクタの場合、あなたは大丈夫です。私が気づいたことから、今日のドライブのほとんどは、ドライブの最初にセクターの損傷を受けます(最初の数GB)が、それは主にオペレーティングシステム(あなたの場合ではない)によるものです。一般に、ほとんどの場合、不良セクタは最初は一緒にクラスター化されているため、同じドライブにデータの2つのコピーがあると役立ちます。

重要なファイルが数個しかない場合は、安全のためにそれらを別の場所に保存することをお勧めします。暗号化されたアーカイブを作成してスティックに置くか、信頼できる人に渡します。


1
「メモ」の部分には、使用されている特定のHDDがリストされています(Toshiba STOR.Eの基本750 GB)。また、ドライブの電源を入れて接続すると故障までの推定時間が短縮されるという主張について、何らかの参考文献にリンクできますか?主張する理由がないわけではなく、他の人が本質的に反対を提案しているというだけです。
アインポクルム

メンテナンスを実行する必要がなく、電源を入れるとリスクが高くなるという主張の根拠として引用できるものはありますか?
fixer1234

メンテナンスを行わないという議論には同意しません。なぜなら、電源が入っていないディスクでさえ、まだ悪くなる可能性があり、電源が入っていないと、あなたはそれを決して検出しないからです。
ハリーマック

統計的には、チェックのために電源を入れると、まったくアクセスしないよりも破損する可能性が高くなります。
オーバーマインド

私はそのような統計を見ていない、との電源を入れたときにも、このような存在している場合、彼らは確かに一度、数回、数時間にわたって適用されない。ディスクに測定可能な損傷を引き起こすには、数千のパワーオンが必要です。
-harrymc

3

あなたのドライブが故障すると仮定するのがトリックであると私はいつも感じてきました。ランダムな故障モードがいくつかあります。ランダムではない障害の場合-ドライブとファイルシステムの2つの側面があります。

ちょっと変わったソースですが、このredditスレッドは、特定の1ビットが10年程度で反転する可能性があることを示唆していますが、1つの反転ビットは、ファイルシステムまたはドライブ自体でECCによって静かに処理されると思われます。

通常、定期的なSMARTテストで、年齢に関連する「大規模」問題を見つけることができます。保留中の再割り当てセクターなどを調べます。デューティサイクルが比較的短いので、あまり目立たないはずですが、ここでは少し妄想しています。繰り返しますが、事態が本当に悪化するまで、ドライブはECCでこれを静かに処理します。

最後に、突然のドライブやコントローラーの死の危険があります。理論的には、ドライブの寿命を最大にすることが知られている制御された低温でドライブすることで、ドライブをベイビーできますが、ドライブに夢中になったことはありません。

ドライブには一定数のスピンアップとスピンダウンがあります(ここでは問題ありません)。ドライブを適切にイジェクトすると、データがドライブにフラッシュされ、ドライブの電源を切るツールがあります。hdparmはそれを行うと信じていますが、もう少しテストが必要です。

最後に、持続することがわかっているドライブを選択します。また、外部ドライブを数年ごとに回転させ、古いドライブを階層の下に移動します。

では理論のようなファイルシステムReFSではZFS不可欠なデータのチェックサムしかし、データ損失のリスクを軽減するために設計されています。少なくとも、ファイルが静かに破損することはありません。より一般的なファイルシステム上でそれらを選択すると、データ損失の可能性を減らす可能性がありますが、デスクトップOSにそれらを展開する「簡単な」方法はまだありません。ZFSはLinuxである程度適切にサポートされており、Windowsでは何もサポートされていません。ReFSはまだWindowsデスクトップに移行していません。これらは、実際の回復のために1つ以上のドライブに複数のコピーを保持するように設計されているため、ここでは正確に機能しません。


2
技術的には、ZFS(および多分ReFS)のチェックサムは、データの損失を減らすために何もせず、データの整合性を検証するだけです。エラー/破損から回復するには、パリティドライブまたはミラードライブ(つまり、何らかの冗長性)が必要です。単一のドライブで自力で回復できる(人気のある)ファイルシステムは存在しないと思います(存在する場合は、そのためにドライブスペースを犠牲にする必要があります)。
ボブ

それを反映するために更新されました。これらのファイルシステムは本当に仕事ではないだろう多くの更なる原因に行く気にしませんでした彼のユースケース/
ジャーニーマンオタク

ええ、この種のシナリオのチェックサムの唯一の利点は、少なくともどのファイル/ドライブを信頼しないかを知っていることです。
ボブ

HDDがただそこにあるのに、なぜセクターが再割り当てされるのですか?つまり、ディスクの内容全体を一時的な(または/dev/null多分?)にコピーした後、SMART統計を確認することをお勧めします。これにより、エラーと再割り当てがトリガーされます。
アインポクルム

これはいい質問です。通常の状況では、特にデューティサイクルが最小限の場合、まったく発生しないはずです。しかし、突然、予期せず、ハードドライブが非常に末期的に死ぬ場合を除いて、実際にドライブに起こることはほとんどありません。私が考えることができる故障モードのほとんどは、予想外の傾向があります。
ジャーニーマンオタク

2

他の人の推奨からわかるように、バックアップに価値がある場合、単一のバックアップリソースは信頼できるソリューションではありません。電子デバイスでの経験は、多くの人に(難しい方法で)IFの問題ではなく、バックアップデバイスが失敗することを教えています。

ハードドライブは、設計上、比較的短期間のデータストレージ用です。2つの優れた記事、https://serverfault.com/questions/51851/does-an-unplugged-hard-drive-used-for-data-archival-deteriorateおよび未使用のハードドライブがデータを失うまでの時間 ハードディスクドライブに保存されたデータの寿命について話し合います。いつものように、走行距離は異なる場合があります。

説明するバックアップソリューションは、バックアップをまったく作成しないよりも優れていますが、単一障害点が残っています。単一のデバイスでバックアップを行うと、火災、洪水、盗難、爆発、デバイス障害などのためにデータのコピーのみを失う危険性があります。したがって、質問は次のとおりです。

目標、つまり信頼できるバックアップを達成するには、複数のバックアップが必要です。データをハードディスクに保存する場合は、ハードディスクドライブに固有の長期的なストレージデータの劣化に対処するために、バックアップで「リフレッシュ」が必要になることがあります。私があなたの靴を履いている場合、元のドライブと同様の2つ目のバックアップドライブを購入し、年に一度、プライマリドライブからセカンダリドライブにデータをコピーします。毎年の終わりに、プロセスを逆にして、セカンダリドライブからプライマリドライブにデータをコピーします。毎年すすぎ、繰り返します。ドライブの1つは、自然災害で唯一のデータコピーを失うことを避けるために、あなたの場所から離れたオフサイトのままにする必要があります。


あなたが言うことはすべて真実ですが、最後の段落だけが質問に答えます。
アインポクルム

リフレッシュのメリットの基礎として引用できるもの、および1年間の期間はありますか?
fixer1234

1

これについては、科学的に裏付けられた信頼できるデータは見つかりませんでした。一般的に、この問題には2つの側面があります。

  1. ビットの腐敗:さまざまな物理的影響により、HDDのプラッターに格納されている磁区に格納されているビットが反転し、HDDのデータが破損する可能性があります。(ディスクはまだ完全に機能しています)
  2. 機械的な問題:ドライブの電源のオン/オフ、プラッターの回転または固定の維持、保管条件および自然な経年劣化により、しばらくするとドライブが使用できなくなる可能性があります。(データまだ完全で回復可能です)

ビット腐敗はこのスレッドで説明されています、2008年の。ユーザーarnaudkは次のように書いています。

私が確認できることから、ハードドライブが室温で暗い隅に動かずに座っているだけであれば、熱駆動の消磁によりデータが失われるのに約22年(詳細は下)かかるようです。実際には、この時間は、ハードドライブのモーター自体から50 km離れた雷雨に至るまでに発生する機械的振動と外部磁場のため、少し短くなります。

信号減衰の許容レベルはシステム設計によって異なりますが、通常10-20%[ref4]の範囲であるため、ビットドメイン全体が20%になるには(-1/326000)* ln(0.8)=約22年かかります弱くすると、熱減磁の効果だけが原因でデータが失われる可能性があります。

(投稿への直接リンク)

それが唯一の推定値です。それが正しければ、5年ごとにドライブ全体を安全に書き換えて、データを「更新」できます。

機械的な問題はさらに謎です。Backblazeは、データセンターで数千台の一般消費者向けのハードディスクを使用し、定期的に健康に関する最新情報を投稿する会社です。4年間の24時間365日の回転の後、20%のハードドライブが死亡し、その傾向が続くと、6年後には半分がなくなってしまうと彼らの推定によると。これは、このGoogleホワイトペーパーの数字とほぼ一致しています。ただし、これはハードディスクの標準的な使用例ではなく、ボックス内でオフラインになっているドライブとはほとんど比較できません。私はこの事例に取り組んだ研究を知りません。

全体として、そのデータに本当に関心がある場合、5年ごとに2つのコピーを保持し、ストレステスト済みの新しいHDDに移動する必要があります。それはすべき合理的に新鮮な磁区とハードウェアを維持しますが、メーリングリストへ。


0

ハードディスクドライブの寿命を延ばすことは、最小限の努力で最高の結果が得られる問題の1つです。包装を解き、強烈な熱、湿度、ほこり、または放射線から離れたしっかりした台の上に置きます。十分な空気の循環があり、子供が偶然それを粉砕する可能性が最も低い場所です。アップグレードが必要になるまで、ハードディスクの寿命は長くなります。

おそらく、消費者として、ハードディスクの寿命を延ばすためにできることはほとんどない(まったくない)ことを受け入れるのは難しいでしょう。ただし、データの生存率を向上させる方法は確かにあります:ReFS、RAID、およびバックアップ。

私を信じて、業界はハードディスクとは対照的にデータ自体の寿命を改善することに取り組んでいます。


損傷から保護することをお勧めします。寿命を延ばすものはほとんどないという主張を支持するために引用できるものはありますか?
fixer1234

-1

私の経験では、頻繁に開始/停止(アイドル/実行)から切り替えるのはHDDにとっては悪いことです。(同じストアの同じHDDを使用する複数のシステムでテストしました。一部のHDDは常に回転を強制し、別のHDDはそうではありませんでした)

すべてのサーバーで、1日に1回「短期」SMARTテストを実行し、週末に「長期テスト」を実行すると、少なくともHDDに障害が発生する可能性があることがわかります。ZFSを使用する場合、HDDのエンタープライズバージョンでは月に1回、コンシューマグレードのHDDでは2週間に1回、定期的な「スクラビング」を行うだけで十分です。

適切で適切な電源もHDDの健全性の要因の1つであり、さらにUPSがランダムな電気サプライズをHDDにバイパスするのを防ぐUPSです。(外付けHDDはコンピューターから電力を得るため、外部HDDにも適用されます)

HDDの実行中の振動/振動は、HDDにとっても良くありません。(ポータブルHDDにとって特に重要です-動作中は動かさないでください)

また、特定のHDDのジョブ(監視、NAS、デスクトップなど)に適したモデルを選択することは、ライブを延長する方法です


1
彼はボックスでそれを実行するとは思わない...
ジャーニーマンオタク

私は実際にそれを実行しません...それは単なるバックアップです。もちろん、私は箱の中からそれを実行しませんでした:-)そのため、UPSや振動などに関するアドバイスは私の場合には関係ありません(それは、一定/頻繁に使用されるディスクに関連します。)
einpoklum

UPSが無関係であるとは言いません。外付けのバックアップドライブであっても、電源を入れる必要があり、電力線で何かが発生した場合は、そのような状況を保護する必要があります。
アレックス

ダウン投票する人は、コメントに理由を残してください。興味深いトピックなので、何が悪いのか聞きたいです。あなたの意見は誰にとっても有益です。
アレックス

-3

一般的に、Linuxシステムの場合、メンテナンスは必要ありません。Windowsシステムは、Linuxよりも頻繁にクラスターを失うようです。そのため、Windowsシステムでは3〜6か月ごとのchkdskが賢明です。

ブッシングとベアリングを備えたすべてのハードドライブ部品は、5年以上の継続的な使用の後、最終的に摩耗による多少のずれを起こします。破損したパーティションでいつか目を覚まさないことがわかった最善の方法は、少なくとも5年ごとに再フォーマットすることです。

一般に、数年ごとにシステムの大規模なオーバーホールを必要とするものがあるため、その時点で再フォーマットします(エラーチェック付きの完全な再フォーマットを必ず使用してください)。私の記憶は一般に、フォーマット後にハードドライブの容量が減少したことに気付くのに十分です。これは、ドライブが故障していることを示しています。システムに慣れていない人は、フォーマット後に正確なバイトカウントの記録を保持できます。

ある時点で(特にこの目的のために)「余分な」セクターが使用され、システムはドライブ上の「通常の」領域を使用不可としてマークし始めます-バイト数は減少します。この時点で、ドライブはスクレイプされるはずです-おそらく既にデータが失われているでしょう。これは、5〜10年で24時間年中無休で保管されるハードドライブでは正常です。

ドライブの寿命を延ばす唯一の方法は、非アクティブな状態が数分間続いた後にシステムの電源を切るように設定することです。マスターバックアップとして使用する2 TBのドライブがあり、10分間使用しないと電源が切れるように設定されています。私はそれにアクセスせずに30日間行くことができるので、オフのままになります。電源が入り、必要に応じて読み取り可能になるまでに20秒かかります。


そのため、議論が保存期間に限定されている場合、定期的に電源が投入されることはありません。「未使用のハードドライブがデータを失うまでの時間」という上記のリンクでカバーされている環境上の懸念 があります。定期的に使用することで長持ちします。そうでなければ、彼らは乾きます。これは、コンデンサー(およびバッテリー)の電気化学構造です。

コンデンサの寿命の目安は20年です。これは20/20ルールと呼ばれます。コンデンサの故障は、最初の20分間で最も高くなり、その後20年間の使用で統計的故障が再び超過します。しかし、使用しないと、20年よりもずっと早く故障します。

電子部品の最も一般的な(一般的に言えば)故障はコンデンサです。コンデンサ(電気化学)、次にインダクタと変圧器(電気機械)は、使用されているかどうかに関係なく摩耗します。


Backblazeという会社が、ハードドライブの障害に関するデータを収集しました。会社のブログでそのデータを公開し、どのメーカーのドライブが他のドライブよりも頻繁に故障したかを強調しています。

最近のブログで、5つのSMART属性のうち、差し迫ったドライブ障害を正確に示すデータを公開しました。

From experience, the following 5 SMART metrics indicate impending disk drive failure:

    SMART 5 – Reallocated_Sector_Count.
    SMART 187 – Reported_Uncorrectable_Errors.
    SMART 188 – Command_Timeout.
    SMART 197 – Current_Pending_Sector_Count.
    SMART 198 – Offline_Uncorrectable.

これらの推奨される5つの統計のようなサブセットを選択できます。これらはメーカー間で一貫しており、障害の優れた予測因子であるためです。

この記事は次のことを示唆しています:

SMART 5:Reallocated_Sector_Count 1-4は注視し、4つ以上を交換します

SMART 187:Reported_Uncorrect 1つ以上の置換

SMART 188:Command_Timeout 1-13は注視し、13個以上を置き換えます

SMART 197:Current_Pending_Sector_Count 1つ以上の置換

SMART 198:Offline_Uncorrectable 1つ以上の置換


4
> Windowsシステムは、Linuxよりもはるかに頻繁にクラスターを失います。そのため、Windowsシステムでは3〜6か月ごとのchkdskが賢明です。[要出典]-そのようなアドバイスを聞いたことがありません。とにかく、2007年以降ではありません。そして、それは、電源が入っていないストレージのハードウェアについて尋ねる質問とはかなり直交しています-あなたが使用しているファイルシステムの種類を本当に気にしないハードウェア。
ボブ

1
また、あらゆる種類のファイルシステムレベルの「不良セクタ」カウントを使用してドライブの状態をチェックするのは奇妙です。それがSMARTの目的です。また、再割り当てされたセクター数と保留中のセクター[再割り当て]数の両方を付随的に報告します(これらのいずれかが0以外の場合は、ドライブを交換するときです)。
ボブ

1
この回答には、役に立つ情報が含まれている可能性がありますが(推測以上のものがある場合)、質問で説明されている明確な要件には答えていません。具体的には、パワーオフハードウェアの寿命を最大限に延ばすための適切なケアとメンテナンスに関するものです。
music2myear

1
@jwzumwalt 組み込みツールの(非)存在は特に重要ではありません。データはそこにあり、ハードウェアとファームウェアはそれをサポートし、CrystalDiskInfoなどのソフトウェアからアクセスできます。(そして、OSを比較する場合、Debianを含む多くのLinux dstrosには組み込み/プリインストールツールはありません。)SMARTは、差し迫ったディスク障害を検出するための業界標準の方法です(公平に言えば、 、より大規模なエンタープライズ環境では、彼らはそれを失敗させて、事実、冗長性に置き換えます。
ボブ

1
「Linuxシステム」または「Windowsシステム」とは何ですか?何を着るの?あなたは私の質問に答えるのではなく、実行中のシステムで使用されているディスクについて話していると思います。
アインポクルム
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.