非常に大きなファイルでのSHA1サムとMD5サムの信頼性はどのくらいですか?


1

SSHを使用してrclone経由でディスクイメージと仮想マシンイメージ(通常800GBから1ファイルあたり1 TB近く)をクラウドサーバーに絶えず転送します。非常に大きなファイルの整合性を検証することに関して、sha1sumとmd5sumがどれほど信頼できるのかと思います。

私はこれを見つけました: 1TBファイルが正しく転送されたことをどのように確認できますか?

ただし、生成されるハッシュの信頼性ではなく、パフォーマンスに関係しています。

別のファイルが非常に多くの個別のファイルがあることを考慮して、生成された同じハッシュを共有する可能性はありますか?

それでは、非常に大きなファイルでのMD5とSHA-1の合計の信頼性はどれくらいですか?ありがとう。

衝突についてもこれを見つけました:https : //stackoverflow.com/questions/4032209/is-md5-still-good-enough-to-uniquely-identify-files

https://www.theregister.co.uk/2017/02/23/google_first_sha1_collision/


非常に不運であるか、それに多大な努力を払わない限り(SHA1の場合)。MD5では、労力が大幅に削減されます。心配な場合は、SHA2またはSHA3のバリエーションを探してください。
-Jakuje

1
鳩の巣の原理誕生日の問題も参照してください。転送検証の目的では、どちらのアルゴリズムも最初のステップとして機能します-pigeonholeは、一致しない合計が間違いなく同じファイルではないことを伝えますが、一致する合計が間違いなく同じであることを証明しません
不安定な

回答:


3

MD5とSHA-1はどちらも、ファイルの偶発的な損傷/変更を検出するのに適しています。同じMD5ダイジェストを持つ誤って変更されたファイルの確率は、2 ^ 128 = 340,282,366,920,938,463,463,374,607,431,768,211,456に1つです。偶発的なSHA-1衝突の確率はさらに小さく、2 ^ 160分の1です。ファイルのコレクション間で偶発的な一致を見つけること(誕生日問題として知られている)について話している場合、MD5衝突が発生する可能性が高くなる前に約2 ^ 64 = 180億が必要になります。ファイルのサイズは重要ではないことに注意してください。重要なのは、関係するファイルの数です。

しかし、MD5もSHA-1も、ファイルの悪意のある置換を保護したり、ファイルに信頼できる一意のIDを提供したりするには十分ではありません。たとえば、どちらかを使用する場合、誰かが1つのファイルを提供し、ハッシュダイジェストを計算してから、同じハッシュを持つ別のファイルと交換することでだまされる可能性があります。または、同じハッシュを持つ2つのファイルを送信すると、システムが混乱する可能性があります。

ところで、偶然/悪意のある区別は少し緩いです。Googleが同じSHA-1ハッシュで作成した2つのPDFを誰かが見つけて、「それはすごい!後で保存するべきだ」と考え、システムを使用してそれらを保存および配布しようとしたとしましょう。 -の偶然。そのようなことが考えられる場合は、代わりにSHA-256を使用することをお勧めします。

編集:BitErrantは、前の段落で説明したものと似ています:BitTorrentはSHA-1チェックサムをファイルのチャンクのIDとして使用するという事実を利用して、BitTorrentに対するエクスプロイトです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.