電話の音声が8 kHzでサンプリングされるのはなぜですか？

8

いつ電話を試してみることにしましたか $8$ kHz？これは常にそうでしたか？なぜそれをしたのですか？それは、より高いビットレートを速く転送できないためですか？そして、これらの理由はまだカウントされますか？そうでない場合、なぜ新しい標準がないのですか？それは本当ですか $8$ kHzは、理解可能な音声を転送するための最低のサンプリングレートですか？

私はこれのソースを見つけようとしていますが、それについて多くの情報がないようです。

audio sampling

— Lewistrick
ソース

2

電話回線は完全にアナログであったため、常にそうであるとは限りません。

— Simon B

2

実際、同じエクスチェンジ内のローカルコールの場合は、完全に類似している可能性があります。しかし、私は知らない。ただし、アナログの場合でも帯域幅に制限があり、「音声品質」で十分でした。

— robert bristow-johnson 2015

私たちが混乱しないように...そしてリフレッシャボーレートとビットレートは同じではありません..ボーは「単位密度のビット」です。ボーはシグナリングレート、ビットは情報レートです。したがって、ボーレートが1200ボーで、クロックサイクルごとに4ビットを通過させている場合は、毎秒4800ビットを実行しています。DSPモデムがあり、アナログ電話回線で150Kb /秒を通過させることができましたが、変調技術は非常に洗練されていました。同様にラインを等しくし、遅延を削除して..私はそのワット一部のモデム見てリコールをパイプの下でデータを移動するために256から512個のオーディオトーンに使用どこでも...がそうであるように

— キース

ああそれを見つけた... US RoboticsはSportster HST v92と呼ばれる2400ボーモデムを作りました。2400ボーでしたが、毎秒21,600ビットを通過しました。したがって、90年代半ばの市場には2400のボーモデムがありました。

— キースは

4

誰かが掘り起こしたいのであれば、ベル電話が音声回線の多重化を始める前に、人間の声の周波数成分について多くの研究を行ったことがわかると思います。彼らは当初、ベルオーディオユニットと声のパワー配分、およびさまざまな周波数に対する人間の耳の感度を開発するためにテストグループを使用していました。彼らは、ピークが約2.1 KHzで、300ヘルツ未満および3000ヘルツを超える帯域通過特性を開発しました。正しく行うと、人間の鳴き声が良くなります。それはすべてアナログでした。
AMラジオはそれを5 KHzに拡張し、私たちが若くて耳が良かったときにほとんどの人に受け入れられる音楽を含めました。テレビのフライバックトランスは、画像の再生にマジックナンバーがあったため、約17.5 KHzで動作するように設計されました。そして、ほとんどの人々は口笛を聞くことができませんでした。単側波帯無線は1960年代に商品化され、非常に鋭いカットオフ周波数が必要でした。私は2.1および3.1 KHzのフィルター付きの無線機を使用しました。2.1にはドナルドダックの特徴がいくつかありました。3.1は正常に聞こえましたが、やはり若い耳でした。FMを使用すると、オーディオのバンドパスが20 KHZ以上に向上しました。これは、高いキャリア周波数でより高い帯域幅を処理して音楽をよりよく再生できるためです。いくつかの木琴、鈴、またはその他の高音の楽器を積み重ねると、高周波に十分な調和エネルギーを得ることができます。OTOH、州と同様に、ほとんどの人はそれを聞くことができません。

つまり、音声に20 KHzの帯域幅が必要だと主張する人は誰も注目していないということです。3 KHzはそれを行います、5はあなたにいくつかのマージンを与えます。それが正しく聞こえない場合は、帯域幅以外の何かが問題です。

デジタルシグナリングが開発されていたとき、波形がどんなに奇妙に見えても、波形が一連の正弦波に分解される可能性があることを知っていた人々。それらの波の調和混合は、声や音楽の典型的なスパイキーパターンを生み出しました。最後に、ナイキストは、所定の周波数で正弦波を再現するために必要なデジタルサンプリングレートについて調査しました。正弦波を作成するには2つのサンプルが必要なので、再現される最高周波数はサンプルレートの半分です。5 KHzのオーディオが必要で、次に10 KHzでサンプリングします。声に問題ありません。ほとんどの人が聞くことができるよりも高い忠実度の音楽が必要で、40 KHz程度でサンプリングして20+ KHzを取得します。

もう1つの問題は、サンプリングとビットレートです。特定の周波数でサンプリングする場合は、それにワード長を掛けると、目的の信号を生成するために必要な最小ビットレートが得られます。ビットレートを下げると、サンプルワードのサイズが削減され、指定されたサンプルレートで新しいビットレートに適合します。これがすべて「ロスレス」エンコーディングです。これはすべてメモリからのものであり、現在のデータを検索しようとしています。誰かが引用を探していればそこにあります。私は年を取りすぎて気にならなくなるので、気にするつもりはありません。オーディオキャプチャに興味があったとき、私は多くの明らかな神話的な問題に目を通すのに飽きた。

— Nothermark
ソース

5

品質と帯域幅の間の適切なトレードオフを提供すると考えられていました。実際には、単一の音声信号が8 kbpsではなく8 kHzの帯域幅を占有します。各サンプルは8ビットに量子化され、一般的に使用される64 kbpsのレートを生成します。

参考文献：

— エムレ
ソース

3

音声信号が8 kHzでサンプリングされる場合、その帯域幅は8 kHzではなく4 kHz未満であると想定されます。また、結果の生PCM 64 kbpsビットレートは、DPCMおよびADPCM技術により、効率が必要な場合はいつでも32 kbpsまたは16 kbpsに下げることができます。

— Fat32 2015年

それは本当です。それだけでなく、ローパスフィルタリングによって4 kHz未満を占めることが保証されています。それ以外の場合、エイリアシングが発生します。

— Emre 2015年

次に、「実際には単一の音声信号が8 kbpsではなく8 kHzの帯域幅を占有する」と答えを検討する必要があると思います。音声信号は20〜20 kHzの全スペクトルを占めることができますが、最初の4 kHzのみが伝送に使用されます。

— Fat32、2015年

人間の耳はその範囲の周波数を識別できると言うつもりですか？それは別の問題です。

— Emre

2

もう1つの理由は、デジタル信号を送信する前は、電話の音声が狭帯域チャネルにアナログ変調されていたため、複数の通話を単一のアナログリンク（RFやマイクロ波タワーリレーなど）で送信できるためです。最初にローパスフィルター処理を行い、各チャネルに必要な帯域幅を狭めて、最大数のチャネルを1つのアナログパイプに詰め込みます（ただし、悪い日でも、隣接する通話の一部をバックグラウンドとして聞くことができます）ノイズ）。人々は3.5 kHzを超える周波数のない長距離通話に慣れているので、この帯域幅は市内通話でも商業的に受け入れられるようになりました。

ただし、より狭い帯域幅が初期の宇宙探査通信に使用されたため、3.5 kHzは理解可能な音声の最小値ではない可能性があります。

— hotpaw2
ソース

1

多くの誤解を解消するため。

まず、56kの「ボー」モデムはこれまでありませんでした。ボーは状態変化に関するもので、1200ボーで最大になりました。それを超えるものには、より高度なエンコーディングが必要です。

第二に、人間の聴覚は、基本音だけでなく、基本音をはるかに超えた多くの次数の高調波成分も知覚します。その高調波コンテンツが削除されると、オーディオは自然で心地よい音ではなくなります。高解像度（8Khzよりも）のオーディオは、聞き取りやすく、耳に心地よいものです。

第3に、ナイキストは固定時間領域内で動作します。ピークまたはトラフの正確な瞬間にサンプリングを開始する場合、必要なのは周波数の2倍のサンプルレートだけです。ただし、現実の世界では、サンプルポイントはピークまたはトラフまでの任意のランダムオフセットで発生する可能性があるため、より高いサンプリングレートが必要です。たとえば、正弦波をサンプリングし、サンプルモーメントが波の開始から正確に90度オフセットで発生する場合、データは波ではなく直線を示します。基本的なトーンでは、これは重要です。ハーモニックコンテンツの場合は、可聴範囲の上限近くでリターンが減少するため、より良いものになります。オーディオ処理に適用されるナイキストは、世の中で最も解釈が不十分な定理の1つです。

— リッチ
ソース

1200ボーを超えるモデムがないという主張についてのリファレンスはありますか？その主張は間違っていると思います。また、その価値については、サンプリングに関する段落が間違っています。正弦波をサンプリングする場合、位相に関係なく、正弦波の周波数の2倍を超えるサンプリングレートで十分です。

— MBaz 2018年

0

他の人として、それが自然に人間の声がどこにあるので、4kHzのは、標準であると述べているソース1 ソース2。私は、基本周波数がはるかに低い85Hz-300Hzでのある言及し、この1件の記事見つけた記事を。これが実際に機能するかどうかは確かではありません。しかし、試してみる価値があります

— アンドリュー
ソース

0

アナログ電話システムには、3.9 KHzのブリックウォールフィルターがありました。これにより、わかりやすい音声に必要なすべての情報が渡され、帯域幅のパッキングが可能になりました。多くの人々は必要な帯域幅についての彼らの考えで洗脳されました。20〜20,000 Hzの帯域幅は音楽には最適ですが、人間の音声を再生するために完全に不要です。

誰かがナイキストに、3.9 KHzのブリックウォールフィルターを使用して56 KBaudのFAX信号をアナログ回線経由でどのように送信したかを尋ねてください。誰かがファックス機を覚えていますか？

ピアノの最高音は4186 Hzです。人間の声の周波数範囲は約1000 Hz未満です。ピアノのミドルCは約262 Hzです。

— ユーザー1634448
ソース