jpgファイルを開こうとすると、「JPEGファイルではありません:0x890x50で始まります」というメッセージが表示されるのはなぜですか。
回答:
あなたのファイルはJPEGファイルではありません。途中でPNGからJPEGに名前が変更されただけです。一部のプログラムは、これを認識されたファイル拡張子として開き、プレフィックスからタイプを推測しますが、明らかに使用しているものではありません。
* .jpgの名前を* .pngに変更するだけです。または、このファイルをブラウザで開きます
これは、libjpegを使用してjpegファイルを開くJPEGファイルビューアを使用してPNGファイルを開こうとした場合のエラー応答です。以前の回答で述べたように、ファイルの名前がpngからJPEGに変更されます。
これは、ディレクトリ内のこれらの障害jpg画像を識別するためのPythonスクリプトです。
import glob
import os
import re
import logging
import traceback
filelist=glob.glob("/path/to/*.jpg")
for file_obj in filelist:
try:
jpg_str=os.popen("file \""+str(file_obj)+"\"").read()
if (re.search('PNG image data', jpg_str, re.IGNORECASE)) or (re.search('Png patch', jpg_str, re.IGNORECASE)):
print("Deleting jpg as it contains png encoding - "+str(file_obj))
os.system("rm \""+str(file_obj)+"\"")
except Exception as e:
logging.error(traceback.format_exc())
print("Cleaning jps done")
これは、Mohitのスクリプトの修正バージョンです。誤った名前のファイルを削除する代わりに、非破壊的に名前を変更します。
また、os.system()呼び出しをサブプロセス呼び出しと交換し、ファイル名の引用符に関するエスケープの問題を解決します。
import glob
import subprocess
import os
import re
import logging
import traceback
filelist=glob.glob("/path/to/*.jpg")
for file_obj in filelist:
try:
jpg_str = subprocess.check_output(['file', file_obj]).decode()
if (re.search('PNG image data', jpg_str, re.IGNORECASE)) or (re.search('Png patch', jpg_str, re.IGNORECASE)):
old_path = os.path.splitext(file_obj)
if not os.path.isfile(old_path[0]+'.png'):
new_file = old_path[0]+'.png'
elif not os.path.isfile(file_obj+'.png'):
new_file = file_obj+'.png'
else:
print("Found PNG hiding as JPEG but couldn't rename:", file_obj)
continue
print("Found PNG hiding as JPEG, renaming:", file_obj, '->', new_file)
subprocess.run(['mv', file_obj, new_file])
except Exception as e:
logging.error(traceback.format_exc())
print("Cleaning JPEGs done")