人々の耳には、周波数が20 Hz〜20 kHzの音が聞こえます。ナイキストの定理に基づいて、記録レートは少なくとも40 kHzでなければなりません。44.1 kHzを選択した理由は何ですか?
人々の耳には、周波数が20 Hz〜20 kHzの音が聞こえます。ナイキストの定理に基づいて、記録レートは少なくとも40 kHzでなければなりません。44.1 kHzを選択した理由は何ですか?
回答:
あらゆる慣例と同様に、44.1 kHzの選択は一種の歴史的な事故であることは事実です。他にもいくつかの歴史的な理由があります。
もちろん、20 kHzの帯域幅で高品質のオーディオが必要な場合、サンプリングレートは40 kHzを超える必要があります。
48.0 kHzにするという議論がありました(24フレーム/秒のフィルムと北米のテレビの表向きの30フレーム/秒とうまく調和していました)が、物理的なサイズが120 mmであるため、 CDが保持、その与えられた可能性が誤り検出及び訂正スキームが必要であった、それが必要とするいくつかのデータの冗長性を、CDが(MB 700について)を記憶することができる論理的なデータの量は、物理的なデータの量の約半分です。48 kHzのレートで、そのすべてを考えると、我々は、それがベートーベンの第九のすべてを保持することができなかったこと、それがいることを言われた可能性がわずかに遅い速度で1枚のディスクに全体の第九を開催します。48 kHzが出ています。
それでも、なぜ44.0や45.0 kHzではなく44.1なのか、それともいいラウンド数なのか?
その後、当時、1970年代後半に、Sony F1と呼ばれる製品がありました。この製品は、デジタルオーディオを簡単に入手できるビデオテープ(VHSではなく、ベータマックス)に記録するように設計されていました。それは44.1 kHz(より正確には44.056 kHz)でした。したがって、これにより、F1からCDまたは他の方向に、リサンプリングや補間なしで録音を簡単に転送できます。
NTSC TVの水平スキャンレートは15.750 kHzで、44.1 kHzは正確に2.8倍であることがわかりました。よくわかりませんが、それはつまり、水平線ごとに3つのステレオサンプルペアを持つことができ、通常5つのラインごとに15のサンプルがある場合、14のサンプルといくつかの追加のサンプルがあることを意味すると思いますF1のパリティチェックまたは冗長性。5ラインの14サンプルは、水平ラインごとに2.8サンプル、1秒あたり15,750ラインと同じで、1秒あたり44,100サンプルになります。
現在、カラーテレビが導入されてから、水平ラインレートを1秒あたり15734ラインにわずかに下げる必要がありました。この調整により、Sony F1では1秒あたり44,056サンプルになります。
たとえば、http://www1.cs.columbia.edu/~hgs/audio/44.1.htmlを見てください。アンチエイリアシングフィルターのため、サンプリングレートは40 kHz以上にする必要があります。フィルターの応答スロープによる信号の歪みを防ぐために、周波数をある程度確保する必要があります。44.1 kHzの実際の値は、1979年にオーディオ録音規格が議論されていたときにSony corpによって提案されました。その瞬間にこのレートを広く使用していました。
それは一般的に歴史的な理由です。
デジタル形式への移行では、オーディオは、黒または白(バイナリ形式を表す)のいずれかと見なすことができる擬似ビデオ波形に保存されました。
テレビ規格で使用されるフィールドレートと構造は、60 Hzビデオの場合、次のとおりです。フィールドあたり245行(最初の35行の空白行を除く)。60 x 245 x 3 = 44100 = 44.1 KHzになる行ごとに3つのサンプルがあります。
この規則は、機器の互換性の問題により、後でCD形式に使用されました(CD複製に使用されるCDマスターの作成に使用された最初の機器はビデオベースでした)。
典型的な静的な正弦波ではなく、「動的な」時間分解能の観点から見た場合、人間の聴覚制限は20kHzよりもはるかに高い可能性があります。再構成フィルタリングの20kHz〜22kHzのマージンに関する興味深いコメントもあります。実際、Hi-Fi再生用に少なくとも96kHzを主張する時間領域最適化フィルタリングについて、Peter Cravenから非常に興味深い研究がありました。
パヴェル
https://en.wikipedia.org/wiki/44,100_Hz#Why_44.1_kHz.3F ナイキスト-シャノンのサンプリング定理は、サンプリング周波数は再現したい最大周波数の2倍より大きくなければならないことを示しています。人間の聴覚範囲は約20 Hz〜20,000 Hzであるため、サンプリングレートは40 kHzを超える必要がありました。
さらに、エイリアシングを防ぐために、サンプリングの前に信号をローパスフィルターする必要があります。理想的なローパスフィルターは20 kHz未満の周波数を完全に通過させ(減衰せず)、20 kHzを超える周波数を完全に遮断しますが、このような理想的なフィルターは理論的に不可能です(非因果性)ので、実際には遷移帯域が必要です。周波数が部分的に減衰します。この遷移帯域が広いほど、アンチエイリアシングフィルターを作成するのが簡単で経済的です。44.1 kHzのサンプリング周波数により、2.05 kHzの遷移帯域が可能になります。
さらに、44,100は最初の4つの素数の平方の積(2 ^ 2 * 3 ^ 2 * 5 ^ 2 * 7 ^ 2)であるため、多くの有用な小さな因子があります。
[ http://batmobile.blogs.ilrt.org/audio-analysis-on-an-iphoneの説明を参照してください。ナイキストサンプリング定理と呼ばれる定理は、品質を大きく損なうことなくX Hzの信号をサンプリングするには、周波数の2倍でサンプリングする必要があると述べています。人間の聴覚の限界は約20kHzであるため、約40Khzのサンプルレートが必要です。これが、CDが44Khzでサンプリングされる理由です。つまり、CDに記録される各秒には、記録に含まれる可能な限り高い周波数の44,000の測定値が含まれます。