Windowsで拡張子なしのファイルタイプを判断するにはどうすればよいですか?


150

クライアントから間違ったファイル拡張子を持つファイルを取得することがあります。たとえば、名前はimage.jpg違いますが、ファイルは実際にはTIFF画像です。多くの場合、テキストエディターでファイルを開き、最初の数バイトを調べて、それがどのファイルタイプであるかを推測することで、それを明確にすることができます。

これは、JPEG、TIFF、GIF、およびPDFファイルで機能します。ただし、他にも多くのファイルタイプがあります。

含まれているデータを分析することにより、正しいファイルタイプの識別を自動化することは可能ですか?


36
興味がある人のために、fileコマンドは* nixマシンでこれを行います。
-boehj

10
この質問がトピックから外れている理由がわかりません(3年後)。特定のソフトウェアを要求しません(これを強調するために質問を書き換えました)。私は解決策を求めています。
マーティン14

2
上記のboehj * nix関連のコメントが「投稿に役立つものを追加する」と26人が考える理由がわかりません。この質問にはタグが付けられてwindowsいますが、コメントでは「Windowsではできません。代わりに* nixを使用する必要があります」と示唆されています。そう?コメントは「興味のある人向け」に向けられています。何で?コンピューターを変更しますか?:(
-Aacini

2
Googleからここに来る* nix人に役立つ@Aacini。
jingyu9575

回答:


145

ファイルを識別するファイルタイプ定義のライブラリが増えているTrIDツールを使用できます。

スクリーンショット

ワイルドカードがサポートされているため、この例では、検査対象のすべての画像をフォルダー(C:\ verifyimagesなど)に入れることができます。次のコマンドを使用できます。

trid C:\verifyimages\*

これにより、verifyimagesフォルダー内のすべてのファイルが検査されます。


利用可能なGUIバージョンTrIDNetもあります。

スクリーンショット

TrIDまたはTrIDNetをWindowsエクスプローラーおよびTotal Commanderに簡単に統合する方法については、ドキュメントを参照してください。

Windowsエクスプローラ

総司令官


4
それは商業使用のためにライセンスされていないことを示していることに注意してください、個人使用のみ
クリスマグナソン

2
このプログラムを使用するために必要なダウンロードファイルを特定するのに苦労しました。したがって、このコメントはそれを支援するためのものです。2つのファイルをダウンロードする必要があります。まず、コマンドラインユーティリティまたはGUIユーティリティのいずれか。次に、「TrID XML defs」と呼ばれるXML定義のフォルダー。定義XMLファイルをTrIDと同じディレクトリに配置します。次に、定義をスキャンします。最後に、使用を開始できます。
mrtsherman

明確にしてくれてありがとう、mrtsherman。私も混乱していました。ドキュメントは改善できますが、素晴らしいツールです!
Jウッドチャック

52

ファイル

ファイルは、各引数を分類しようとしてテストします。ファイルシステムテスト、マジックナンバーテスト、言語テストの3つのテストセットがこの順序で実行されます。最初の成功したテストは、ファイルタイプが印刷させます。

印刷されたタイプは、通常、単語のいずれかが含まれますテキストを(ファイル、印刷文字といくつかの一般的な制御文字のみが含まれており、おそらくASCII端末で読むことが安全である)、実行(ファイルの形式でプログラムをコンパイルした結果が含まれています一部のUNIXカーネルや別に理解)、またはデータ(データは通常「バイナリ」または非印刷可能である)何かを意味します。例外は、バイナリデータを含むことが知られている既知のファイル形式(コアファイル、tarアーカイブ)です。


1
file標準ですが、古いシステム(特にLinux以外)ではあまり知識がありません。Ubuntuなどの場合、それは非常に立派であり、標準としてインストールされる必要があります。
トールビョーンラヴンアンデルセン

1
@Anm_LA、それはWindowsではまったく標準ではありませんが、答えのリンクはGNUバージョンのfileWindowsへの移植です。Windowsユーザーとして他の* nixコマンドがおもしろい場合は、そのサイトを調べてあらゆる種類の宝石を見つけてください。
RBerteig

2
fileWindowsアプリケーションによって作成されたファイルのエキスパートであることは非常に疑わしい。
ロビングリーン

5
@Robin:テストを歓迎します。
イグナシオバスケス-エイブラムス

11
@Robin:あなたが使用fileしたことは非常に疑わしいが、その有効性についてはほとんど決心している。
tzot

13

私はかつてフランス国立図書館で働き、デジタル化された本だけでなく、あらゆる種類の奇妙なファイルタイプを持つ数百万のデジタルアーティファクトを含むデジタルアーカイブシステムを構築していました。JHOVEを使用してファイル形式を認識しました。

JHOVEはオープンソースであり、JSTORとハーバード大学図書館によって管理されています。使用するのはかなり簡単です。


クール!しかし、TrIDのような独自の形式を認識しますか?とにかく、私非所有権のある形式のサブ形式/バリアント(または正確には、標準化された形式への所有権のある「拡張」)を識別するためにいくつかの用途があります。ヘッズアップをありがとう!
ペポルアン


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.