JavaでファイルのMD5チェックサムを取得する


510

ファイルのMD5チェックサムを取得するためにJavaを使用したいと考えています。私は本当に驚きましたが、ファイルのMD5チェックサムを取得する方法を示すものを見つけることができませんでした。

それはどのように行われますか?


多分これは役立つでしょう。スペックを調べることもできますが、複雑なため、実行に時間がかかります。
waynecolvin 2008年

4
最近の調査によると、「MD5は暗号的に破壊されており、今後の使用には不適切であると見なされるべきです」ということを覚えておいてください。en.wikipedia.org/wiki/MD5
Zakharia Stanley

80
MD5は暗号的に安全であるとは見なされなくなりましたが、ファイルの整合性を検証するにはまだ十分であり、SHAよりも高速です。
jiggy

2
@ZakhariaStanleyチェックサムについての質問です。
iPherian

ファイルのMD5チェックサムの標準的な使用法は、分散ファイルの敵意のある置換を回避することです。安全ではありません。しかし、悪意のある悪用が問題にならないシナリオでは、完全に適しています。
Keith Tyler、

回答:


541

入力ストリームデコレータがありjava.security.DigestInputStream、データを追加で渡す必要がなく、通常どおりに入力ストリームを使用しながらダイジェストを計算できます。

MessageDigest md = MessageDigest.getInstance("MD5");
try (InputStream is = Files.newInputStream(Paths.get("file.txt"));
     DigestInputStream dis = new DigestInputStream(is, md)) 
{
  /* Read decorated stream (dis) to EOF as normal... */
}
byte[] digest = md.digest();

4
私が同意するのは、バイトで何かをすでに実行している(つまり、HTTP接続からそれらを読み取る)場合に、チェックサムをオンザフライで計算する非常にエレガントな方法です。
Marc Novakowski、2008

2
@AlPhabaをisとして宣言しましたInputStreamFileInputStreamFileInputStreamこのエラーの原因となる、あなたが使用したように聞こえます。
エリクソン2012

1
@barwnikk Java 8で正常に動作します。これMethodNotFoundは標準Javaの例外ではありません。おそらくあなたはコンパイラエラーについて話しているのですか?いずれにしても、うまくいかない場合は、ローカル構成の問題か、他のコードの問題です。
エリクソン2014年

4
@barwnikk繰り返しますが、これはローカル構成の問題です。これは有効なJava 7およびJava 8コードです。2006年以降のツールに行き詰まっている場合は、適応する必要があります。
エリクソン2014

5
@ericksonファイルの内容でMessageDigestオブジェクトを更新していません。Rt?このコードは常に同じダイジェストを出力します。
sunil 2014年

302

Apache Commons CodecライブラリのDigestUtilsを使用します。

try (InputStream is = Files.newInputStream(Paths.get("file.zip"))) {
    String md5 = org.apache.commons.codec.digest.DigestUtils.md5Hex(is);
}

1
私のAndroidコードでは機能しませんこのエラーが表示されます... java.lang.NoSuchMethodError:org.apache.commons.codec.binary.Hex.encodeHexString at org.apache.commons.codec.digest.DigestUtils.md5Hex (DigestUtils.java:215)
JPM

@JPMをダウンロードcommons-codec.jarして、クラスパスにすでに置いていると思いますか?
Leif Gruenwoldt

はい、そこにあり、私は自分のandroidプロジェクトにエクスポートしました。コードをステップ実行でき、クラスはソースファイルにあります。
JPM 2012年

1
同じ問題がありましたが、このコードで修正されました `FileInputStream fis = new FileInputStream(new File(filePath)); バイトデータ[] = org.apache.commons.codec.digest.DigestUtils.md5(fis); char md5Chars [] = Hex.encodeHex(data); 文字列md5 = String.valueOf(md5Chars); `
Dmitry_L

1
いいね!新しいプロジェクトの場合は、新しい依存関係を追加する前に常に2度考えますが、既存のプロジェクトの場合は、ライブラリをすでに使用しているかどうかを確認する必要があります。+1
OscarRyz 2013

164

RealのJava-How-toMessageDigestクラス使用した例があります。

CRC32とSHA-1の使用例については、このページを確認してください。

import java.io.*;
import java.security.MessageDigest;

public class MD5Checksum {

   public static byte[] createChecksum(String filename) throws Exception {
       InputStream fis =  new FileInputStream(filename);

       byte[] buffer = new byte[1024];
       MessageDigest complete = MessageDigest.getInstance("MD5");
       int numRead;

       do {
           numRead = fis.read(buffer);
           if (numRead > 0) {
               complete.update(buffer, 0, numRead);
           }
       } while (numRead != -1);

       fis.close();
       return complete.digest();
   }

   // see this How-to for a faster way to convert
   // a byte array to a HEX string
   public static String getMD5Checksum(String filename) throws Exception {
       byte[] b = createChecksum(filename);
       String result = "";

       for (int i=0; i < b.length; i++) {
           result += Integer.toString( ( b[i] & 0xff ) + 0x100, 16).substring( 1 );
       }
       return result;
   }

   public static void main(String args[]) {
       try {
           System.out.println(getMD5Checksum("apache-tomcat-5.5.17.exe"));
           // output :
           //  0bb2827c5eacf570b6064e24e0e6653b
           // ref :
           //  http://www.apache.org/dist/
           //          tomcat/tomcat-5/v5.5.17/bin
           //              /apache-tomcat-5.5.17.exe.MD5
           //  0bb2827c5eacf570b6064e24e0e6653b *apache-tomcat-5.5.17.exe
       }
       catch (Exception e) {
           e.printStackTrace();
       }
   }
}

70
うん... 11年後もまだオンライン!:-)
RealHowTo 2008年

RealのJava-How-Toの例は完全に機能し、実装も簡単でした。
bakoyaro

読み取りループは少し不格好です。read()はゼロを返さず、a do/whileは適切ではありません。
ローン侯爵

10
@EJPタイムリーなフィードバックをありがとう。
トカゲに請求する

バイト[]バッファ=新しいバイト[1024]; サイズを1024からもっと最適なものに変更できますか?
ジャルペッシュ

90

com.google.common.hash APIの提供:

  • すべてのハッシュ関数のための統一されたユーザーフレンドリーなAPI
  • murmur3のシード可能な32ビットおよび128ビットの実装
  • md5()、sha1()、sha256()、sha512()アダプターは、これらを切り替えるコードを1行だけ変更し、つぶやきます。
  • goodFastHash(int bits)、使用するアルゴリズムを気にしない場合
  • HashCodeインスタンスの一般的なユーティリティ(combinedOrdered / CombineUnorderedなど)

ユーザーガイドを読んでください(IOの説明ハッシュの説明)。

ユースケースでFiles.hash()は、ファイルのダイジェスト値を計算して返します。

たとえば ダイジェスト計算(SHA-1をMD5に変更してMD5ダイジェストを取得)

HashCode hc = Files.asByteSource(file).hash(Hashing.sha1());
"SHA-1: " + hc.toString();

ご了承ください よりもはるかに速いです ので、使用 暗号的に安全なチェックサムが必要ない場合。また、 パスワードを使用する場合、ブルートフォースを簡単に実行できるため、パスワードなどの保存に使用しないでください。 または 代わりに。

ハッシュによる長期的な保護のために、 マークル署名スキームがセキュリティに追加され、欧州委員会が後援するPost Quantum Cryptography Study Groupは、量子コンピューターに対する長期的な保護のためにこの暗号の使用を推奨しています(参考文献)。

ご了承ください 他よりも高い衝突率を持っています。


上記のFiles.hashのどの部分がFiles.hashをカバーしていませんか?
oluies

2
Files.hash()非推奨としてマークされ、推奨される方法は次のとおりです。Files.asByteSource(file).hash(Hashing.sha1())
erkfel

1
そして2018年1月の時点でHashing.sha1()非推奨とマークされています。Hashing.sha256()代わりに関数が推奨されます。ソース
MagicLegend

60

nio2(Java 7+)を使用し、外部ライブラリなし:

byte[] b = Files.readAllBytes(Paths.get("/path/to/file"));
byte[] hash = MessageDigest.getInstance("MD5").digest(b);

結果を予想されるチェックサムと比較するには:

String expected = "2252290BC44BEAD16AA1BF89948472E8";
String actual = DatatypeConverter.printHexBinary(hash);
System.out.println(expected.equalsIgnoreCase(actual) ? "MATCH" : "NO MATCH");

@Arashはい、絶対に-ありがとう。JDK FilesクラスとGuavaを混同しました。
アッシリア2016年

エリクソンよりもこのソリューションが好きです。オプションでラップして純粋な関数型プログラミングを使用できるからです
Gabriel Hernandez

2
大きなファイルの場合、ファイル全体が読み取られ、チャンクを読み取ってそれらを「ダイジェスト」するのではなく、ファイル全体が読み取られてダイジェストに送られるため、大量のメモリを使用します。
bernie 2018

39

Guavaは、JDKで提供されるさまざまなハッシュAPIよりもはるかにユーザーフレンドリーな新しい一貫したハッシュAPIを提供するようになりました。Hashing Explainedを参照してください。ファイルの場合、MD5サム、CRC32(バージョン14.0以降)、またはその他の多くのハッシュを簡単に取得できます。

HashCode md5 = Files.hash(file, Hashing.md5());
byte[] md5Bytes = md5.asBytes();
String md5Hex = md5.toString();

HashCode crc32 = Files.hash(file, Hashing.crc32());
int crc32Int = crc32.asInt();

// the Checksum API returns a long, but it's padded with 0s for 32-bit CRC
// this is the value you would get if using that API directly
long checksumResult = crc32.padToLong();

32

OK。追加しなければなりませんでした。SpringおよびApache Commonsの依存関係をすでに持っているか、追加する予定のある人のための1行の実装:

DigestUtils.md5DigestAsHex(FileUtils.readFileToByteArray(file))

とApacheコモンズのみのオプション(クレジット@duleshi):

DigestUtils.md5Hex(FileUtils.readFileToByteArray(file))

これが誰かを助けることを願っています。


1
それですDigestUtils.md5Hex(FileUtils.readFileToByteArray(file))
duleshi

ファイル全体をメモリに読み込まないため、David Onterコモンズベースのソリューションの方が優れています。
フランマルゾア2018年

少なくとも、ファイル全体をメモリに読み込まずに、MD5ダイジェストを計算し、MD5ダイジェストメソッドの16進数の文字列表現を計算するSpring 5 必要があります。DigestUtils.md5Digest(InputStream inputStream)DigestUtils.md5DigestAsHex(InputStream inputStream)
マイクShauneu

24

Java 7を使用したサードパーティのライブラリを使用しないシンプルなアプローチ

String path = "your complete file path";
MessageDigest md = MessageDigest.getInstance("MD5");
md.update(Files.readAllBytes(Paths.get(path)));
byte[] digest = md.digest();

このバイト配列を印刷する必要がある場合。以下のように使用

System.out.println(Arrays.toString(digest));

このダイジェストから16進文字列が必要な場合。以下のように使用

String digestInHex = DatatypeConverter.printHexBinary(digest).toUpperCase();
System.out.println(digestInHex);

ここで、DatatypeConverterはjavax.xml.bind.DatatypeConverterです。


なぜtoUpperCase
EdgeCaseBerg

@edgecasebergは、16進文字列をコンソールに
出力

toUpperCase()の代わりにtoLowerCase()を使用する必要があることがわかりました。
Splendor

14

私は最近、これを動的な文字列に対してのみ実行する必要MessageDigestがあり、ハッシュをさまざまな方法で表すことができました。md5sumコマンドで取得するようなファイルの署名を取得するには、次のようにする必要があります。

try {
   String s = "TEST STRING";
   MessageDigest md5 = MessageDigest.getInstance("MD5");
   md5.update(s.getBytes(),0,s.length());
   String signature = new BigInteger(1,md5.digest()).toString(16);
   System.out.println("Signature: "+signature);

} catch (final NoSuchAlgorithmException e) {
   e.printStackTrace();
}

これは明らかにファイルに対して具体的にどのように行うかについてのあなたの質問に答えません、上記の答えは静かにうまく対処します。私は多くの時間を費やして、ほとんどのアプリケーションがそれを表示するように合計を取得し、同じ問題に遭遇する可能性があると考えました。


署名は16進形式のダイジェストです。私も16進数表現が機能することを発見しましたが、他の表現は機能しません。これを置いてくれてありがとう。
amit

これは良い.toString(16)ことですが、先行ゼロは捨てられます。String.format("%032x", ...)多分よくなる。
ハロルド

11
public static void main(String[] args) throws Exception {
    MessageDigest md = MessageDigest.getInstance("MD5");
    FileInputStream fis = new FileInputStream("c:\\apache\\cxf.jar");

    byte[] dataBytes = new byte[1024];

    int nread = 0;
    while ((nread = fis.read(dataBytes)) != -1) {
        md.update(dataBytes, 0, nread);
    };
    byte[] mdbytes = md.digest();
    StringBuffer sb = new StringBuffer();
    for (int i = 0; i < mdbytes.length; i++) {
        sb.append(Integer.toString((mdbytes[i] & 0xff) + 0x100, 16).substring(1));
    }
    System.out.println("Digest(in hex format):: " + sb.toString());
}

または、詳細情報 http://www.asjava.com/core-java/java-md5-example/



9

前の投稿で上記のコードに似たコードを使用していた

...
String signature = new BigInteger(1,md5.digest()).toString(16);
...

ただし、BigInteger.toString()先頭のゼロが切り捨てられるため、ここでの使用には注意してください...(たとえば、try s = "27"、checksumは"02e74f10e0327ad868d138f2b4fdd6f0"

次に、Apache Commons Codecを使用するよう提案し、独自のコードを置き換えました。


1
うわー、ファイルが31桁の16進数字しか出力せず、md5checksumsが失敗することを除いて、MD5がすべてに対して完全に機能していた問題を調べていました。先頭の0の切り捨ては大変な苦痛です...ご連絡ありがとうございます。
Mike

8
public static String MD5Hash(String toHash) throws RuntimeException {
   try{
       return String.format("%032x", // produces lower case 32 char wide hexa left-padded with 0
      new BigInteger(1, // handles large POSITIVE numbers 
           MessageDigest.getInstance("MD5").digest(toHash.getBytes())));
   }
   catch (NoSuchAlgorithmException e) {
      // do whatever seems relevant
   }
}

8

外部ライブラリに依存しない非常に高速でクリーンなJavaメソッド:

(MD5をSHA-1、SHA-256、SHA-384、またはSHA-512に置き換えてください)

public String calcMD5() throws Exception{
        byte[] buffer = new byte[8192];
        MessageDigest md = MessageDigest.getInstance("MD5");

        DigestInputStream dis = new DigestInputStream(new FileInputStream(new File("Path to file")), md);
        try {
            while (dis.read(buffer) != -1);
        }finally{
            dis.close();
        }

        byte[] bytes = md.digest();

        // bytesToHex-method
        char[] hexChars = new char[bytes.length * 2];
        for ( int j = 0; j < bytes.length; j++ ) {
            int v = bytes[j] & 0xFF;
            hexChars[j * 2] = hexArray[v >>> 4];
            hexChars[j * 2 + 1] = hexArray[v & 0x0F];
        }

        return new String(hexChars);
}


6

標準のJavaランタイム環境の方法

public String checksum(File file) {
  try {
    InputStream fin = new FileInputStream(file);
    java.security.MessageDigest md5er =
        MessageDigest.getInstance("MD5");
    byte[] buffer = new byte[1024];
    int read;
    do {
      read = fin.read(buffer);
      if (read > 0)
        md5er.update(buffer, 0, read);
    } while (read != -1);
    fin.close();
    byte[] digest = md5er.digest();
    if (digest == null)
      return null;
    String strDigest = "0x";
    for (int i = 0; i < digest.length; i++) {
      strDigest += Integer.toString((digest[i] & 0xff) 
                + 0x100, 16).substring(1).toUpperCase();
    }
    return strDigest;
  } catch (Exception e) {
    return null;
  }
}

結果は、linux md5sumユーティリティと同じです。


6

これは、ファイルをパラメーターとして受け取るように、Sunilのコードをラップする単純な関数です。この関数には外部ライブラリは必要ありませんが、Java 7が必要です。

import java.io.File;
import java.io.IOException;
import java.nio.file.Files;
import java.security.MessageDigest;
import java.security.NoSuchAlgorithmException;

import javax.xml.bind.DatatypeConverter;

public class Checksum {

    /**
     * Generates an MD5 checksum as a String.
     * @param file The file that is being checksummed.
     * @return Hex string of the checksum value.
     * @throws NoSuchAlgorithmException
     * @throws IOException
     */
    public static String generate(File file) throws NoSuchAlgorithmException,IOException {

        MessageDigest messageDigest = MessageDigest.getInstance("MD5");
        messageDigest.update(Files.readAllBytes(file.toPath()));
        byte[] hash = messageDigest.digest();

        return DatatypeConverter.printHexBinary(hash).toUpperCase();
    }

    public static void main(String argv[]) throws NoSuchAlgorithmException, IOException {
        File file = new File("/Users/foo.bar/Documents/file.jar");          
        String hex = Checksum.generate(file);
        System.out.printf("hex=%s\n", hex);            
    }


}

出力例:

hex=B117DD0C3CBBD009AC4EF65B6D75C97B

3

ビルドにANTを使用している場合、これは非常に単純です。次をbuild.xmlに追加します。

<checksum file="${jarFile}" todir="${toDir}"/>

ここで、jarFileはMD5を生成する対象のJARであり、toDirはMD5ファイルを配置するディレクトリです。

詳細はこちら。


3

Googleグアバは新しいAPIを提供します。以下のものを見つけてください:

public static HashCode hash(File file,
            HashFunction hashFunction)
                     throws IOException

Computes the hash code of the file using hashFunction.

Parameters:
    file - the file to read
    hashFunction - the hash function to use to hash the data
Returns:
    the HashCode of all of the bytes in the file
Throws:
    IOException - if an I/O error occurs
Since:
    12.0

3

以下は、InputStream.transferTo()Java 9とOutputStream.nullOutputStream()Java 11 から利用できる便利なバリエーションです。外部ライブラリは必要なく、ファイル全体をメモリにロードする必要もありません。

public static String hashFile(String algorithm, File f) throws IOException, NoSuchAlgorithmException {
    MessageDigest md = MessageDigest.getInstance(algorithm);

    try(BufferedInputStream in = new BufferedInputStream((new FileInputStream(f)));
        DigestOutputStream out = new DigestOutputStream(OutputStream.nullOutputStream(), md)) {
        in.transferTo(out);
    }

    String fx = "%0" + (md.getDigestLength()*2) + "x";
    return String.format(fx, new BigInteger(1, md.digest()));
}

そして

hashFile("SHA-512", Path.of("src", "test", "resources", "some.txt").toFile());

戻り値

"e30fa2784ba15be37833d569280e2163c6f106506dfb9b07dde67a24bfb90da65c661110cf2c5c6f71185754ee5ae3fd83a5465c92f72abd888b03187229da29"

2
public static String getMd5OfFile(String filePath)
{
    String returnVal = "";
    try 
    {
        InputStream   input   = new FileInputStream(filePath); 
        byte[]        buffer  = new byte[1024];
        MessageDigest md5Hash = MessageDigest.getInstance("MD5");
        int           numRead = 0;
        while (numRead != -1)
        {
            numRead = input.read(buffer);
            if (numRead > 0)
            {
                md5Hash.update(buffer, 0, numRead);
            }
        }
        input.close();

        byte [] md5Bytes = md5Hash.digest();
        for (int i=0; i < md5Bytes.length; i++)
        {
            returnVal += Integer.toString( ( md5Bytes[i] & 0xff ) + 0x100, 16).substring( 1 );
        }
    } 
    catch(Throwable t) {t.printStackTrace();}
    return returnVal.toUpperCase();
}
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.