はい、ロスレス圧縮は多くのファイルがランダムではないという事実を利用しています。はい、ほとんどのマルチメディアファイルはランダムではありません。
FAX画像はこの効果の良い例です。最も単純な形式では、ファックスイメージは、あるドキュメントの1ページをスキャンして得られる2D白黒イメージです。この画像をビットのシーケンス、ピクセルごとに1ビット(0 =白、1 =黒)として表すと、結果のバイナリデータがまったくランダムではないことがわかります。たとえば、次のようなランダムでないパターンを見つけます。
通常、FAX画像には、黒のピクセルよりも白のピクセルが多く含まれています。
また、各ピクセルは、左のピクセルと同じ色である可能性が、異なる色である可能性よりも高くなります。
より洗練されたパターンの場合:ピクセルを水平に左から右にスキャンし、同じ色の連続するピクセルの各「ラン」の長さを数えることを想像してください。次に、長いランは短いランよりも一般的であり、白いピクセルの長いランは黒いピクセルの長いランより一般的です。
FAX圧縮アルゴリズムは、これらのランダムでない側面を利用するように設計されています。初期のFAX圧縮アルゴリズムは、スキャンされた画像のこれらの非ランダムプロパティを非常に直接活用する単純な可逆圧縮方式であるため、特に良い例です。
たとえば、FAX画像を圧縮するための初期のスキームでは、ランレングスエンコーディングとハフマンエンコーディングを組み合わせて使用していました。ランレングスエンコーディングは、同じ色のピクセルの各ランを、ランの長さをカウントする単一の整数に置き換えます。たとえば、00000110001は「5 2 3 1」になります。ランレングスエンコーディングは、ピクセルが同じ色のランに入る傾向があるという事実を利用しています。ハフマンエンコーディングは、一部のランレングスが他よりも一般的であるという事実をさらに利用しています。これらの初期のスキームの1つがどのように機能したかについての詳細な例については、ここを参照してください。このスキームはシンプルで洗練されており、上記のパターンを直接利用します。
これらのスキームは、平均して、ランダムファイルに対して圧縮を提供しません。ただし、スキャンされたFAXイメージはランダムではないため、これらの圧縮スキームにより大幅な節約が可能になります。
同様のコメントが他のマルチメディアファイルにも適用されます。他の種類のマルチメディアファイルに存在するパターンはより複雑になる可能性がありますが、データをランダムでないものにする多くのパターンが存在します。