簡潔な答え
エントロピー(死とも呼ばれます!)のため、長い時間枠を保証することは不可能です。デジタルデータは崩壊し、宇宙の他の物と同様に死にます。しかし、それは遅くなる可能性があります。
現在、30年以上のコールドデータアーカイブを保証する、フェイルプルーフで科学的に証明された方法はありません。Long Now博物館のRosetta Disksプロジェクトのように、いくつかのプロジェクトはそれを目指していますが、それらはまだ非常にコストが高く、データ密度が低い(約50 MB)ものです。
それまでの間、科学的に証明された弾力性のある光学メディアを使用して、パナソニックのようなブルーレイディスクHTLタイプ、またはバーバティムゴールドアーカイブのようなアーカイブグレードDVD + Rのような冷蔵保管し、ソフトスポットの気密ボックスに保管することができます(避ける)高温)と光のうち。
また、冗長化:データ(少なくとも4)の複数のコピーを作成し、計算はすべてが大丈夫であることを定期的にチェックするためにハッシュし、数年ごとに新しいディスク上のデータを書き換える必要があります。また、多くのエラー修正コードを使用すると、破損したデータを修復できます!
長い答え
時間とともにデータが破損するのはなぜですか?その答えは、エントロピーという言葉にあります。これは、宇宙の主要で避けられない力の1つであり、システムが時間の経過とともに次第に秩序を失います。データの破損とは、ビット順序の乱れです。つまり、宇宙はあなたのデータを嫌っています。
エントロピーと戦うことは、死と戦うこととまったく同じです。あなたは成功する可能性は決してありません。しかし、エントロピーを遅らせることができるように、死を遅らせる方法を見つけることができます。破損を修復することでエントロピーをだますこともできます(つまり、破損を止めることはできませんが、事前に対策を講じれば、破損が発生した後に修復できます!)。生と死に関するものと同じように、魔法の弾丸も、すべてのための1つのソリューションもありません。最良のソリューションでは、データのデジタルキュレーションに直接関与する必要があります。そして、あなたがすべてを正しく行ったとしても、あなたはあなたのデータを安全に保つことを保証されません、あなたはあなたのチャンスを最大にするだけです。
良いニュースのために:良い品質のストレージメディアと優れたアーカイブ/キュレーション戦略を組み合わせる場合、データを保持するための非常に効率的な方法があります:失敗に備えて設計する必要があります。
優れたキュレーション戦略とは何ですか?わかりやすく説明しましょう。見つける情報のほとんどは、アーカイブに関するものではなく、バックアップに関するものです。問題は、ほとんどの人がバックアップ戦略に関する知識をアーカイブに移すことであり、多くの神話が今では一般的に聞かれているということです。実際、数年間のデータの保存(バックアップ)と、少なくとも数十年にわたる可能な限り長い時間のデータの保存(アーカイブ)はまったく異なる目標であるため、異なるツールと戦略が必要です。
幸いなことに、非常に多くの研究と科学的結果があるので、フォーラムや雑誌ではなく、それらの科学論文を参照することをお勧めします。ここで、私の読み物のいくつかを要約します。
また、そのようなまたはそのような記憶媒体が完全であると主張して、主張と非独立の科学的研究に注意してください。有名なBBC Domesdayプロジェクトを思い出してください:«Digital Domesday Bookは1000年ではなく15年続きます»。本当に独立した論文で研究を常に再確認し、ない場合は、保存媒体がアーカイブに適していないと常に仮定します。
探しているものを明確にしてみましょう(質問から):
長期アーカイブ:賢明で再現性のない「個人」データのコピーを保持する必要があります。アーカイブは、より根本的に異なるバックアップとして、ここでも説明:バックアップ、アーカイブであるのに対し、定期的に更新されますので、バックアップ(すなわち、OS、作業フォルダのレイアウトなど)にリフレッシュする必要があるダイナミックな技術データのためのものである静的なデータをそのあなたはたぶん一度だけ書くだけで、時々読むだけでしょう。アーカイブは、通常は個人的な一時データ用です。
コールドストレージ:アーカイブデータのメンテナンスを可能な限り避けたい。これは大きな制約です。というのは、媒体は非常に長い間安定しているコンポーネントと記述方法を使用する必要があることを意味します。ユーザーからの操作やコンピューターや電源への接続は必要ありません。
分析を容易にするために、まず冷蔵ソリューションを検討してから、長期アーカイブ戦略を検討しましょう。
低温貯蔵媒体
上記のように、優れたコールドストレージメディアを定義しました。操作を必要とせずに長時間データを保持する必要があります(そのため、「コールド」と呼ばれます。クローゼットに保管するだけで、接続する必要はありません。データを維持するコンピューター)。
紙は地球上で最も弾力性のある記憶媒体のように見えるかもしれません。なぜなら、私たちはしばしば古代からの非常に古い原稿を見つけるからです。ただし、紙には大きな欠点があります。まず、データ密度が非常に低く(小さな文字やコンピューターツールを使用しても、紙に最大100 KBを超えて保存できない)、監視する方法がなければ時間とともに劣化します:紙、ハードドライブと同様に、サイレント破損の影響を受けます。ただし、デジタルデータのサイレントな破損を監視することはできますが、紙の上ではできません。たとえば、画像が同じ色を10年間だけ保持することを保証することはできません。色は劣化し、元の色を見つける方法はありません。もちろん、キュレートできます 画像復元のプロであれば写真を使用しますが、これには非常に時間がかかりますが、デジタルデータを使用すると、このキュレーションおよび復元プロセスを自動化できます。
ハードドライブ(HDD)の平均寿命は3〜8年であることが知られています。それらは時間とともに劣化するだけでなく、最終的には死ぬことが保証されています(アクセス不能)。次の曲線は、すべてのHDDが驚異的な速度で死ぬ傾向を示しています。
エラータイプを考慮したHDD故障率の進化を示すバスタブ曲線(設計されたデバイスにも適用可能):
HDD故障率を示す曲線、すべてのエラータイプがマージされました:
ソース:Backblaze
故障に関連して、3種類のHDDがあることがわかります。急速に死にかけているHDD(例:製造エラー、HDDの品質不良、ヘッドの故障など)、絶えず死にかけているHDD(良い製造、さまざまな「通常の」理由、これはほとんどのHDDに当てはまります)、そして最終的にはほとんどのHDDよりも少し長生きし、最終的に「通常のもの」のすぐ後に死ぬ堅牢なもの(例:ラッキーHDD、あまり使われない、理想的な環境条件など)。したがって、HDDが死ぬことが保証されます。
HDDが頻繁に死ぬのはなぜですか?つまり、データは磁気ディスクに書き込まれ、磁場は消えるまで何十年も続くことがあります。彼らが死ぬ理由は、記憶媒体(磁気ディスク)と読み取りハードウェア(電子ボード+回転ヘッド)が結合されているためです:それらは分離できず、磁気ディスクを取り出して別のヘッドで読み取ることはできません電子ボード(物理データをデジタルに変換する)は、ほぼすべてのHDDで異なり(同じブランドとリファレンスであっても、元の工場によって異なります)、スピニングヘッドの内部メカニズムは非常に複雑なため、今日では不可能です人間が磁気ディスクに完全に回転ヘッドを配置し、それらを殺すことはありません。
さらに、HDDは使用しないと時間がたつと減磁することが知られています(SSDを含む)。したがって、データをハードディスクに保存し、クローゼットに保存し、電気接続なしでデータを保持すると考えることはできません。少なくとも年に1回または数年に1回、HDDを電源に接続する必要があります。したがって、HDDは明らかにコールドストレージには適していません。
磁気テープ:多くの場合、バックアップのニーズに応えるものとして、またアーカイブの拡張として説明されています。磁気テープの問題は、非常に敏感であるということです:磁気酸化物粒子は、太陽、水、空気、引っかき傷によって容易に劣化し、時間や電磁装置によって消磁されたり、時間の経過とともに脱落したり、プリントスルーします。そのため、通常は専門家がデータセンターでのみ使用します。また、10年以上データを保持できることが証明されたことはありません。それでは、なぜ彼らはしばしばバックアップを勧められますか?以前は安価だったため、当時は、磁気テープを使用する方がHDDより10倍から100倍安く、HDDは今よりずっと安定性が低い傾向がありました。そのため、費用対効果のため、磁気テープは主にバックアップに推奨されます回復力のためではなく、データのアーカイブに関して最も関心があるのは回復力です。
CompactFlashおよびSecure Digital(SD)カードは、非常に頑丈で堅牢であることが知られており、壊滅的な状況に耐えることができます。
ほとんどのカメラのメモリカードは事実上破壊不可能であると、Digital Camera Shopperマガジンで発見されました。5つのメモリカードフォーマットは、コーヒーやコーラで煮詰められ、踏みつけられ、洗われ、浸されて生き残りました。
ただし、他の磁気ベースのメディアと同様に、データを保持するために電界に依存しているため、カードが使い果たされた場合、データが完全に失われる可能性があります。したがって、コールドストレージには最適ではありません(電界を更新するためにカード上のデータ全体を時々書き換える必要があるため)が、バックアップや短期または中期のアーカイブに適した媒体になる可能性があります。
光学媒体:光学媒体は、CD、DVD、Blu-ray(BD)など、レーザーを使用してデータを読み取るストレージ媒体の一種です。これは紙の進化と見ることができますが、データを非常に小さなサイズで書き込むため、紙よりも正確で弾力性のある素材が必要でした。光ディスクはまさにそれです。光学メディアの2つの最大の利点は、ストレージメディアが読み取りハードウェアから分離されていること(つまり、DVDリーダーが故障した場合、いつでも別のディスクを購入してディスクを読み取ることができること)、およびレーザーに基づいていることです。将来の証明(つまり、レーザーの作り方を知っている限り、CAMILEONがDomesday BBC Projectで行ったように、いつでもレーザーを微調整してエミュレーションで光ディスクのビットを読み取ることができます)。
他のテクノロジーと同様に、新しいイテレーションでは密度が高くなる(ストレージルーム)だけでなく、エラー訂正が改善され、環境の劣化に対する回復力が向上します(常にではありませんが、一般的に正しい)。DVDの信頼性に関する最初の議論は、DVD-RとDVD + Rの間であり、DVD-Rが今でも一般的であっても、DVD + Rはより信頼性が高く正確であると認識されています。現在、アーカイブグレードのDVDディスクは、特に冷蔵保管用に作られており、メンテナンスなしで最低20年まで耐えることができると主張しています。
Verbatim Gold Archival DVD-R [...]は、評判の高いドイツのc't誌(c't 16/2008、ページ116-123)による徹底的な長期ストレステストで最も信頼性の高いDVD-Rとして評価されています。 )[...] 18年の最小耐久性と32〜127年の平均耐久性(25℃、湿度50%)を達成しています。これらの値に近いディスクは他にありません。2番目に優れたDVD-Rの最小耐久性はわずか5年でした。
LinuxTech.netから。
さらに、一部の企業は専門に非常に長期のDVDアーカイブと広く、彼らが1000年以上にわたってデータを保持できると主張し、MillenniataまたはDataTresorDiscからM-ディスクのように、それらを販売、およびによって検証いくつかの(非依存しない)の研究から( 2009)あまり科学的でない他の人の間で。
これはすべて非常に有望なようです!残念ながら、これらの主張を確認するのに十分な独立した科学的研究はなく、利用可能ないくつかの研究はそれほど熱心ではありません。
湿度(80%RH)および温度(80°C)は、データの可読性を定期的にチェックする2000時間(約83日間)のテストで、いくつかのDVDのエージングを加速しました。
フランスのデジタルデータアーカイブ機関(Archives de France)から翻訳、2012年からの研究。
最初のグラフは、劣化の進行が遅いDVDを示しています。急速な劣化曲線を持つ2枚目のDVD。3番目は、M-DiscやDataTresorDiscなどの特別な「非常に長期的な」DVD用です。ご覧のように、それらのパフォーマンスはクレームに完全には適合せず、標準グレードの非アーカイブグレードDVDと比べて低いか、同等です!
ただし、M-DiscやDataTresorDiscなどの無機光ディスクには1つの利点があります。これらは、光の劣化にまったく影響を受けません。
240時間の光(750 W /m²)を使用した加速老化:
これらはすばらしい結果ですが、Verbatim Gold ArchivalなどのアーカイブグレードのDVDも同じパフォーマンスを達成し、さらに、オブジェクトにとって最も制御可能なパラメーターは光です。光のあらゆる影響を取り除きます。光よりも温度と湿度に強い弾力性のあるDVDを入手する方がはるかに便利です。
この同じ研究チームはまた、Blu-ray市場を調査して、長期の低温貯蔵に適した媒体を持つブランドがあるかどうかを確認しました。彼らの発見は次のとおりです。
DVDと同じパラメーターの下で、いくつかのBlu-rayブランドで湿度と温度が老化を加速しました。
いくつかのBluRaysブランドの光加速老化、同じパラメーター:
2012年のフランス公文書館のこの研究からの翻訳。
こことここで、すべての調査結果の2つの要約(フランス語)。
微妙に言えば、最高のBlu-rayディスク(パナソニック製)は、湿度+温度テストにおいて最高のアーカイブグレードDVDと同様に動作しましたが、光にはほとんど影響を受けませんでした!そして、このBlu-rayディスクはアーカイブグレードでもありません。さらに、Blu-rayディスクはDVDよりも強化されたエラー修正コードを使用し(CDに比べて強化されたバージョンを使用します)、データを失うリスクをさらに最小限に抑えます。したがって、一部のBluRayディスクは、コールドストレージに非常に適していると思われます。
実際、一部の企業は、パナソニックやソニーなどのアーカイブグレードの高密度ストレージBlu-rayディスクに取り組み始めており、平均寿命50年で300GBから1TBのストレージを提供できると発表しています。また、大企業は、Blu-rayディスクを「コールド」として使用するロボットシステムを開発したFacebookなど、コールドストレージ用の光学媒体(電力を供給せずにコールドストアできるため、消費するリソースがはるかに少ないため)システムがめったにアクセスしないデータ用のストレージ。
ロングナウアーカイブイニシアチブ:ロングナウ博物館によるロゼッタディスクプロジェクトなど、他にも興味深いリードがあります。これは素晴らしいプロジェクトです。これは、非常に長期間のコールドストレージ用に50 MBを保存できるメディアを提供する最初のプロジェクトです(カーボンで記述されているため)。データ(Blu-rayのバイオレットビームのような、奇妙なフォーマット仕様や処理する技術的な手間はありません。拡大鏡が必要です!)ただし、これらはまだ手動で作成されているため、約2万ドルの費用がかかると推定されており、個人的なアーカイブスキームとしては少なすぎます。
インターネットベースのソリューション:データをコールドストアするもう1つの媒体はネット上です。ただし、クラウドバックアップソリューションは、データを保持したい限り、クラウドホスティング企業が存続できない可能性があることを第一に懸念するため、適切ではありません。他の理由には、バックアップがひどく遅い(インターネット経由で転送されるため)ことや、ほとんどのプロバイダーがファイルをオンラインに保つためにシステム上に存在することを要求するという事実が含まれます。たとえば、CrashPlanとBackblazeはどちらも、過去30日間に少なくとも1回はコンピューターに表示されていないファイルを永久に削除するため、外部ハードドライブのみに保存するバックアップデータをアップロードする場合は、少なくとも月に1回USB HDDを使用し、クラウドと同期してカウントダウンをリセットします。しかしながら、SpiderOakなど、一部のクラウドサービスは、カウントダウンなしでファイルを無期限に保持することを提供します(もちろん支払いを行う限り)。そのため、選択したクラウドベースのバックアップソリューションの条件と使用法に十分注意してください。
クラウドバックアッププロバイダーに代わる方法は、独自のプライベートサーバーをオンラインでレンタルすることです。可能な場合は、ハードウェア障害が発生した場合にデータの自動ミラーリング/バックアップ機能を備えたサーバーを選択します(いくつかは、契約で失われたデータに対しても保証します) 、しかしもちろんそれはより高価です)。これは優れたソリューションです。1つ目はまだデータを所有しているため、2つ目はハードウェアの障害を管理する必要がないため、これはホストの責任です。ホストが廃業した場合でも、データを取り戻すことができます(夜中にシャットダウンしないように深刻なホストを選択しますが、事前に通知します。それを契約に入れるように依頼できます)。他の場所で再ホストします。
独自のプライベートオンラインサーバーを設定する手間が不要で、余裕がある場合、AmazonはGlacierと呼ばれる新しいデータアーカイブサービスを提供します。目的は、データを長期にわたってコールドストアすることです。したがって、Glacierにデータを保存するにはかなりの費用がかかりますが、このサービスは手の届かない場所にデータを保存するため、このデータを取得するにはさらに費用がかかります、頻繁にアクセスしたいデータを保持しません。これは、このサービスがデータの書き込み価格だけでなく、読み取り価格も見積もることを意味します。このサービスには莫大な費用がかかりますが、いくつかの最も賢明なデータにはかなりの価値があるかもしれません(つまり、非常に賢明なテキストファイルまたは画像がいくつかある場合、この種のデータは通常サイズが小さいため、氷河に保管するのにそれほど費用はかかりません)。
コールドストレージの欠点:ただし、コールドストレージメディアには大きな欠陥があります。コールドストレージメディアはデータの整合性を自動的にチェックできないため、整合性チェックはありません(エラー修復スキームを実装して、破損後の損傷が発生しましたが、それを防ぐことも自動的に管理することもできません!)コンピューターとは対照的に、ファイルシステムを計算/ジャーナライズ/チェックおよび修正する処理ユニットがないためです。一方、コンピューターと複数のストレージユニットを使用すると、アーカイブの整合性を自動的に確認し、必要に応じてデータアーカイブで破損が発生した場合(同じアーカイブのコピーが複数ある限り)、別のユニットに自動的にミラーリングできます。
長期アーカイブ
現在利用可能な最高の技術を使用しても、デジタルデータは数十年(約20年)しか保存できません。したがって、長期的には、コールドストレージだけに頼ることはできません。データを将来的に(技術的な変更があっても)取得し、リスクを最小限に抑えるために、データアーカイブプロセスの方法論を設定する必要があります。あなたのデータを失うことの。つまり、データのデジタルキュレーターになり、破損が発生したときに修復し、必要に応じて新しいコピーを再作成する必要があります。
絶対確実なルールはありませんが、ここにいくつかの確立されたキュレーション戦略と、特にあなたの仕事を簡単にする魔法のツールがあります:
- 冗長性/複製の原理:冗長性は、エントロピーの効果を元に戻すことができる唯一のツールです。これは、情報理論に基づく原理です。データを保持するには、このデータを複製する必要があります。エラーコードは、冗長性の原則を正確に自動適用したものです。ただし、データが冗長であることも確認する必要があります:異なるディスク上の同じデータの複数のコピー、異なるメディア上の複数のコピー(固有の問題のために1つのメディアが失敗した場合、異なるメディア上の他のメディアも同時に失敗する可能性はほとんどありません) 、エンジニアリングでは3モジュラー冗長性とも呼ばれるデータのコピーを常に3つ以上保持する必要があります。これにより、コピーが破損した場合、3つのコピーからファイルを修復するために単純多数決を投じることができます。船乗りのコンパスに関するアドバイスを常に覚えておいてください。
コンパスを2つ持ってくるのは無意味です。1つが間違っていると、どちらが正しいか、または両方が間違っているかを知ることができないためです。常に1つまたは3つ以上のコンパスを使用してください。
エラー修正コード:これは、あなたの人生をより簡単にし、データをより安全にする魔法のツールです。エラー修正コード(ECC)は、データを修復するために使用できるデータを生成する数学的構造です。これは、より効率的であるのECCは、単純なレプリケーションよりもストレージ容量の少ない多くを使用してデータのより多くを修復することができます(つまり、あなたのファイルの複数のコピーを作る)、そして彼らも、あなたのファイルは、いずれかを持っているかどうかを確認するために使用することができます破損、さらにはそれらの破損の場所を特定する。実際、これはまさに冗長性の原則のアプリケーションですが、レプリケーションよりも賢い方法です。この技術は、4G、WiMax、NASAの宇宙通信など、現在のあらゆる長距離通信で広く使用されています。不運なことに、ECCはテレコミュニケーションに広く見られますが、ファイルの修復ではありません。おそらくそれは少し複雑だからです。ただし、よく知られている(現在は古い)PAR2、DVD Disaster(光ディスクにエラー修正コードを追加することを提供する)、およびpyFileFixity(PAR2の制限と問題を克服するために一部開発しています)など、一部のソフトウェアは利用可能です。LinuxのZFSやWindowsのReFSなど、オプションでReed-Solomonを実装するファイルシステムもあります。これらは技術的にはRAID5を一般化したものです。
ファイルの整合性を定期的に確認してください:ファイルをハッシュし、時々チェックします(つまり、1年に1回ですが、記憶媒体と環境条件によって異なります)。ファイルが破損していることがわかったら、生成したECCを使用して修復するか、新しいストレージメディアにデータの新しいコピーを作成します。データのチェック、破損の修復、新しい新しいコピーの作成は、データの安全性を保証する非常に優れたキュレーションサイクルです。ファイルのコピーは静かに破損する可能性があるため、特に確認することは非常に重要です。改ざんされたコピーをコピーすると、完全に破損したファイルになってしまいます。これは、データの整合性を自動的にチェックできない光ディスクなどのコールドストレージメディアではさらに重要です(ECCを実装して、少し回復しますが、しかし、彼らは新しい新鮮なコピーを自動的にチェックも作成もできません、それがあなたの仕事です!)。ファイルの変更を監視するには、rfigc.pyスクリプトを使用できますpyFileFixityかのような他のUNIXツールmd5deep。Hard Drive Sentinelやオープンソースのsmartmontoolsなどのツールを使用して、ハードドライブなどの一部のストレージメディアのヘルスステータスを確認することもできます。
アーカイブメディアをさまざまな場所に保管し(家の外に少なくとも1つのコピーがある!)、洪水や火事などの現実の壊滅的なイベントを回避します。たとえば、職場にある1枚の光ディスク、またはクラウドベースのバックアップは、この要件に対処するための良いアイデアです(クラウドプロバイダーは、他のコピーがあればいつでもシャットダウンできますが、安全です) 、クラウドプロバイダーは緊急時にのみオフサイトアーカイブとして機能します)。
環境パラメーターが制御された特定の容器に保管します。光学媒体の場合は、湿気を避けるために、光の当たらない水密の箱に保管してください。ハードドライブとsdカードの場合は、残留磁気がドライブを改ざんしないように、耐磁性スリーブに保管してください。また、気密および水密のバッグ/ボックスに保存し、冷凍庫に保存することもできます:温度が遅いとエントロピーが遅くなり、そのようなストレージメディアの寿命を大幅に延ばすことができます中に入らないでください。そうしないと、媒体はすぐに死にます。
使用する良質のハードウェアをし、事前にそれらを確認してください(例:あなたはSDカードを購入するとき、すべてがあなたのデータを書き込む前に大丈夫であることを確認するためにこのようなHDDのスキャンなどのソフトウェアを使用してカード全体をテスト)。これは光学ドライブにとって特に重要です。Archivesde Franceの調査で実証されているように、品質が焼けたディスクの品質を大きく変える可能性があるためです(DVDバーナーの品質が悪いとDVDの寿命が長くなります)。
ファイル形式を慎重に選択してください。すべてのファイル形式が破損に対して回復力があるわけではなく、明らかに弱いものもあります。たとえば、1つまたは2つのバイトのみを改ざんすると、.jpgイメージが完全に壊れて判読できなくなる可能性があります。7zipアーカイブについても同じです。これはばかげているので、アーカイブするファイルのファイル形式に注意してください。経験則として、単純なクリアテキストが最適ですが、圧縮する必要がある場合は非ソリッドzipを使用し、画像にはJPEG2を使用します(まだオープンソースではありません...)。プロデジタルキュレーターの詳細とレビューについては、こちら、こちら、こちらをご覧ください。
データの読み取りに必要なすべてのソフトウェアと仕様をデータアーカイブと一緒に保存します。仕様は急速に変更されるため、ファイルにアクセスできたとしても、将来的にはデータが読み取れなくなる可能性があることに注意してください。したがって、オープンソース形式とソフトウェアを優先し、データに沿ってプログラムのソースコードを保存して、ソースコードからプログラムを常に適応させて新しいOSまたはコンピューターから起動できるようにする必要があります。
他の多くの方法とアプローチは、ここ、ここ、およびインターネットのさまざまな部分で利用できます。
結論
持ちうるものを使用することをお勧めしますが、常に冗長性の原則を尊重し(4つのコピーを作成してください!)、常に整合性を定期的に確認します(したがって、MD5 / SHA1ハッシュのデータベースを事前に生成する必要があります)。破損した場合のコピー。それを行うと、記憶媒体が何であっても、技術的にデータを保持することができます。各チェックの間隔は、記憶媒体の信頼性によって異なります。フロッピーディスクの場合は2か月ごとに、Blu-ray HTLの場合は2/3年ごとに確認してください。
最適な状態では、水密の不透明なボックスに保管し、新鮮な場所に保管したブルーレイHTLディスクまたはアーカイブグレードのDVDディスクを使用することをお勧めします。さらに、SDカードとSpiderOakなどのクラウドベースのプロバイダーを使用して、データの冗長コピーを保存したり、よりアクセスしやすい場合はハードドライブを保存することもできます。
多くのエラー修正コードを使用すると、1日を節約できます。また、これらのECCファイルの複数のコピーを作成できます(ただし、ECCファイルはそれ自体を修復できるため、データの複数のコピーはECCの複数のコピーよりも重要です!)。
これらの戦略はすべて、私が開発中の一連のツール(オープンソース)pyFileFixityを使用して実装できます。このツールは、ファイルの修正を完全に管理するための無料のツールがないことを発見した後、実際にこの議論から始まりました。また、ファイルの固定性とデジタルキュレーションの詳細については、プロジェクトのreadmeとwikiを参照してください。
最後に、この問題に対してより多くの研究開発が行われることを本当に望んでいます。これは私たちの現在の社会にとって大きな問題であり、ますます多くのデータがデジタル化されていますが、この大量の情報が数年以上生き残るという保証はありません。それは非常に憂鬱なことであり、この問題は前面にもっと置くべきだと思います。これは、これがコンストラクターや企業が将来の世代に耐えられるストレージデバイスを作るためのマーケティングポイントになると思います。
/ EDIT:実用的なキュレーションルーチンについては以下をお読みください。