録音サンプリングレートとして44.1 kHzを選択する理由は何ですか?


21

人々の耳には、周波数が20 Hz〜20 kHzの音が聞こえます。ナイキストの定理に基づいて、記録レートは少なくとも40 kHzでなければなりません。44.1 kHzを選択した理由は何ですか?


4
ビデオフレームレートとの互換性のために選択されました。参照en.wikipedia.org/wiki/44,100_Hz#Why_44.1_kHz.3F
endolith

約12〜15kを超える周波数では、音楽的価値がほとんどまたはまったく追加されません。40歳以上のほとんどの人は、そのレベル以上の有用な可聴性はほとんどありません。
クリスヒース

回答:


32

あらゆる慣例と同様に、44.1 kHzの選択は一種の歴史的な事故であることは事実です。他にもいくつかの歴史的な理由があります。

もちろん、20 kHzの帯域幅で高品質のオーディオが必要な場合、サンプリングレートは40 kHzを超える必要があります。

48.0 kHzにするという議論がありました(24フレーム/秒のフィルムと北米のテレビの表向きの30フレーム/秒とうまく調和していました)が、物理的なサイズが120 mmであるため、 CDが保持、その与えられた可能性が誤り検出及び訂正スキームが必要であった、それが必要とするいくつかのデータの冗長性を、CDが(MB 700について)を記憶することができる論理的なデータの量は、物理的なデータの量の約半分です。48 kHzのレートで、そのすべてを考えると、我々は、それがベートーベンの第九のすべてを保持することができなかったこと、それがいることを言われた可能性がわずかに遅い速度で1枚のディスクに全体の第九を開催します。48 kHzが出ています。

それでも、なぜ44.0や45.0 kHzではなく44.1なのか、それともいいラウンド数なのか?

その後、当時、1970年代後半に、Sony F1と呼ばれる製品がありました。この製品は、デジタルオーディオを簡単に入手できるビデオテープ(VHSではなく、ベータマックス)に記録するように設計されていました。それは44.1 kHz(より正確には44.056 kHz)でした。したがって、これにより、F1からCDまたは他の方向に、リサンプリングや補間なしで録音を簡単に転送できます。

NTSC TVの水平スキャンレートは15.750 kHzで、44.1 kHzは正確に2.8倍であることがわかりました。よくわかりませんが、それはつまり、水平線ごとに3つのステレオサンプルペアを持つことができ、通常5つのラインごとに15のサンプルがある場合、14のサンプルといくつかの追加のサンプルがあることを意味すると思いますF1のパリティチェックまたは冗長性。5ラインの14サンプルは、水平ラインごとに2.8サンプル、1秒あたり15,750ラインと同じで、1秒あたり44,100サンプルになります。

現在、カラーテレビが導入されてから、水平ラインレートを1秒あたり15734ラインにわずかに下げる必要がありました。この調整により、Sony F1では1秒あたり44,056サンプルになります。


8

たとえば、http://www1.cs.columbia.edu/~hgs/audio/44.1.htmlを見てください。アンチエイリアシングフィルターのため、サンプリングレートは40 kHz以上にする必要があります。フィルターの応答スロープによる信号の歪みを防ぐために、周波数をある程度確保する必要があります。44.1 kHzの実際の値は、1979年にオーディオ録音規格が議論されていたときにSony corpによって提案されました。その瞬間にこのレートを広く使用していました。

それは一般的に歴史的な理由です。


6

デジタル形式への移行では、オーディオは、黒または白(バイナリ形式を表す)のいずれかと見なすことができる擬似ビデオ波形に保存されました。

テレビ規格で使用されるフィールドレートと構造は、60 Hzビデオの場合、次のとおりです。フィールドあたり245行(最初の35行の空白行を除く)。60 x 245 x 3 = 44100 = 44.1 KHzになる行ごとに3つのサンプルがあります。

この規則は、機器の互換性の問題により、後でCD形式に使用されました(CD複製に使用されるCDマスターの作成に使用された最初の機器はビデオベースでした)。

出典:The Art of Sound Reproduction、p。228


それがF1がすることであるならば、私は「私は修正されたスタンド」と言わなければなりません。F1が空白行を使用していると仮定しました。
ロバートブリストージョンソン

こんにちは、私はここで読む NTSCカラー符号化は、毎秒のビデオの30 / 1.001(約29.97)インターレースフレームから成るシステムMテレビジョン信号と共に使用される」という。各フレームは、それぞれ262.5からなる、2つのフィールドで構成されています合計525スキャンラインのスキャンライン。483スキャンラインが可視ラスタを構成します。残り(垂直ブランキング間隔)により、垂直同期とリトレースが可能になります。
そのため、490行でさえ(元のNTSC)空白行の一部を使用します。
ロバートブリストージョンソン

0

典型的な静的な正弦波ではなく、「動的な」時間分解能の観点から見た場合、人間の聴覚制限は20kHzよりもはるかに高い可能性があります。再構成フィルタリングの20kHz〜22kHzのマージンに関する興味深いコメントもあります。実際、Hi-Fi再生用に少なくとも96kHzを主張する時間領域最適化フィルタリングについて、Peter Cravenから非常に興味深い研究がありました。

パヴェル


まあ、見つける方法があります。Blind AB Testingと呼ばれます。Double-Blindである必要はありません(通常はそうです)。私の意見では、ABテストはABXテストよりも優れています。
ロバートブリストージョンソン

0

https://en.wikipedia.org/wiki/44,100_Hz#Why_44.1_kHz.3F ナイキスト-シャノンのサンプリング定理は、サンプリング周波数は再現したい最大周波数の2倍より大きくなければならないことを示しています。人間の聴覚範囲は約20 Hz〜20,000 Hzであるため、サンプリングレートは40 kHzを超える必要がありました。

さらに、エイリアシングを防ぐために、サンプリングの前に信号をローパスフィルターする必要があります。理想的なローパスフィルターは20 kHz未満の周波数を完全に通過させ(減衰せず)、20 kHzを超える周波数を完全に遮断しますが、このような理想的なフィルターは理論的に不可能です(非因果性)ので、実際には遷移帯域が必要です。周波数が部分的に減衰します。この遷移帯域が広いほど、アンチエイリアシングフィルターを作成するのが簡単で経済的です。44.1 kHzのサンプリング周波数により、2.05 kHzの遷移帯域が可能になります。

さらに、44,100は最初の4つの素数の平方の積(2 ^ 2 * 3 ^ 2 * 5 ^ 2 * 7 ^ 2)であるため、多くの有用な小さな因子があります。


単位時間を1秒から1.001秒である"farg"に変更すると、44100とその多くの有用な小さな要因はどうなりますか?
ロバートブリストージョンソン

-2

[ http://batmobile.blogs.ilrt.org/audio-analysis-on-an-iphoneの説明を参照してください。ナイキストサンプリング定理と呼ばれる定理は、品質を大きく損なうことなくX Hzの信号をサンプリングするには、周波数の2倍でサンプリングする必要があると述べています。人間の聴覚の限界は約20kHzであるため、約40Khzのサンプルレートが必要です。これが、CDが44Khzでサンプリングされる理由です。つまり、CDに記録される各秒には、記録に含まれる可能な限り高い周波数の44,000の測定値が含まれます。


まあ、それは本当にため、その...
jojek

それは部分的にはそのためです。人間が20kを超える音を聞くことはめったにないので、オーディオマニアの範囲は40kHzをわずかに上回ります。つまり、42、43、44です。コウモリは115kHzで、一部のイルカは150kHzですが、それは水中にあるため、より明瞭に聞こえます。録音を使用してオンラインで高周波知覚をテストします...すなわち、ここにaudiocheck.net/audiotests_frequencycheckhigh.php
com.prehensible
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.