モールス符号は、バイナリ、3進、または5進です​​か?


27

私は本を​​読んでいます:「コード:コンピュータのハードウェアとソフトウェアの隠された言語」と第2章で著者は言います:

モールス符号は、コードのコンポーネントがドットとダッシュの2つだけで構成されているため、バイナリ(文字通り2つずつ)コードと呼ばれます。

一方、ウィキペディアはこう言います:

厳密には、5つの基本要素があるため、バイナリではありません(5進を参照)。ただし、これはモールス信号をバイナリコードとして表現できないことを意味するものではありません。抽象的には、これは電信オペレータがメッセージを送信するときに実行する機能です(5項参照)。

しかし、もう一度、ウィキペディアの別のページの「バイナリコードのリスト」にモールス信号が含まれています。

モールス符号は実際には三元系だと思うので、私は非常に混乱しています。沈黙、短いビープ音、長いビープ音の3種類の「可能性」があります。

モールス符号を「stirct binary」で表現することは不可能ではありませんか?

「厳密なバイナリ」とは、バイナリストリームを考えます。1010111101010..沈黙、短いビープ音、および/または長いビープ音をどのように表すのですか?

私が考えることができる唯一の方法は、コンピューターが実装する「ワードサイズ」です。私(およびCPU /コードのインタープリター)が毎回8ビットを読み取ることを知っている場合、モールス符号を表すことができます。単純に1の短いビープ音または0の長いビープ音を表すことができ、無音は暗黙的に単語の長さで表されます(たとえば、8ビット)。したがって、この3番目の変数/私の手:ワードサイズ。

私の考えは次のようになります。最初の3ビットを読み取るビット数に予約し、最後の5ビットを8ビットワードのモールス符号に予約できます。00110000などは「A」を意味します。そして、私はまだ「バイナリ」ですが、それを3進数にする単語サイズが必要ではありませんか?最初の3ビットは、次の5ビットから1ビットのみを読み取ります。

3進数を使用する場合、2進数の代わりに、101021110102110222などのモールス信号を表示できます。ここで、1はdit 0はdah、2は無音です。222を使用すると、長い無音をコーディングできます。したがって、*-* --- *-のような信号がある場合は、102100022210のように表示できますが、1と0だけを使用して直接使用することはできません。私が言ったように「固定」ワードサイズのようなものですが、これは解釈されており、モールス符号をバイナリのまま保存するのではありません。ピアノのようなものを想像してください。ピアノのボタンしかありません。誰かにモールス信号でメッセージを残し、ボタンを黒にペイントすることができます。明確なメッセージを残す方法はありませんか?沈黙(文字と単語の間にある沈黙)を配置できるように、少なくとも1つ以上の色が必要です。これが私が意味するものです。

私は、あなたがモールス法を57-aryまたは他の何かで表現できるかどうかを尋ねていません。

このことについて著者(Charles Petzold)にメールしました。「コード」の第9章でモールス符号をバイナリコードとして解釈できることを実証していると彼は言います。

私の考えのどこが間違っていますか?私が本で読んでいるのは、モールス符号がバイナリであることは事実かどうか?それはどういうわけか議論の余地がありますか?モールス信号が1つのウィキペディアページで5進法であると言われ、バイナリコードのリストページにもリストされているのはなぜですか?

編集:著者にメールを送信し、返信がありました:

- - -オリジナルメッセージ - - -

From:Koray Tugay [mailto:koray@tugay.biz]

送信日:2015年3月3日火曜日午後3時16分

宛先:cp@charlespetzold.com

件名:モールス符号は本当にバイナリですか?

サー、ここで私の質問を見ていただけますか:モールス符号は2進数、3進数、5進数のどちらですか?キナリー?

よろしく、Koray Tugay

From: "チャールズペツォルド"

宛先:「 'Koray Tugay'」

件名:RE:モールス信号は本当にバイナリですか?日付:3

2015年3月23:04:35 EET

「コード」の第9章の終わりに向かって、モールス符号をバイナリコードとして解釈できることを示します。

- - -オリジナルメッセージ - - -

From:Koray Tugay [mailto:koray@tugay.biz]

送信日:2015年3月3日火曜日午後3時16分

宛先:cp@charlespetzold.com

件名:モールス符号は本当にバイナリですか?

サー、ここで私の質問を見ていただけますか:モールス符号は2進数、3進数、5進数のどちらですか?キナリー?

よろしく、Koray Tugay

とにかくウェブ上で見つけるのは本当に簡単なので、私は彼の電子メールを隠していません。


それ以上の会話を移動してくださいchat.stackexchange.com/rooms/21638/...
さすらいのロジック

コメントは詳細なディスカッション用ではありません。この会話はチャットに移動さました
ラファエル

誤って削除したリンクを修正しました(フープ)。より悪いリビジョンへのロールバックを控えてください。
ラファエル

1
@WanderingLogic正しい、最も効果的でノイズのないアプローチは、コメントをクリーンアップするために静かに質問にフラグを立て、コメントをフラグでチャットするように移動することを提案することです。文脈のないすべての答え。また、Raphaelが正しいリンクを投稿しているため、リンクも問題を混乱させるだけです。
ジェイソンC

1
@ J.-E.Pinまあ、質問に答える人はそれを知っていると当然だと思っていたので、正式な定義を与えませんでした。ウィキペディアが完璧とはほど遠い場合でも、ここでよく行われるように、これは定義の役割を果たすことができるはずです。それが問題であり、実際に広範囲に広がっていることを理解するのに時間がかかりました。私は、明示的な定義、引用、参照、および単射準同型を伴う形式的な説明を使用して、すべてを詳細に書き直している過程にありました。終わりますか?
babou

回答:


19

モールス符号は、3つのシンボルをエンコードするプレフィックスバイナリコードの上にあるプレフィックスの3進コード(58文字のエンコード用)です。

受け入れられたときこれははるかに短い答えでし。しかし、ユーザー間のかなりの誤解を考慮し、OPからの要求に従って、私はこのはるかに長い答えを書きました。最初の「簡単な」セクションでは、その要点を説明します。

内容

(大きな)一言で言えば

「モールス符号はバイナリ、3進、5進のどちらですか?」許容可能な回答の基準を修正しない限り、可能な回答を比較することはできません。実際、適切な基準がなければ、ほぼすべての種類の構造について説明することができます。私が選択した基準は次のとおりです。

  • モールス符号の3層の記述と、2段目のドット/ダッシュ表記を反映する必要があります。

  • コードの理論的分析のために開発されたプレゼンテーションおよび数学ツールに可能な限り適合する必要があります。

  • できるだけシンプルにする必要があります。

  • モールス信号の特性を明らかにする必要があります。

これは、科学的に研究されているコード理論の基本概念を無視するarbitrary意的なハッキングを排除することを意図しており、体系的な分析の幻想を与えることで魅力的かもしれませんが、決定的にはあまりにも非公式に対処されています。このサイトは、プログラミングではなく、コンピューターサイエンスに関するものであると想定されて います。技術的な質問に答えるには、最小限の確立された科学と受け入れられた概念を使用する必要があります。

迅速な分析標準ことを示しているモールスコードで使用されるすべてのシンボルが最終的にバイナリで符号化され、それが各ユニットの信号がONであることができるwhith等しい長さの単位の文字列として、またはオフに送信されるので、。これは、モールス信号が最終的に論理アルファベットコーディングされていることを示しています。Σ1={0,1}

しかし、それはコードの内部構造については何も言っていません。エンコードされる情報は、57文字とスペースを含む58シンボル(標準に準拠)のアルファベットの文字列です。これは、アルファベット 、最後のsymblはスペースです。Σ3={A,B,,Z,0,1,,9,?,=,,×,@,[]}

しかし、中間のアルファベットの標準的な指定があることを 、に基づくと、おそらく他の記号は。かなり明確ですΣ2dotdash

  • その内の文字列内の文字列としてコード化されるべきである、およびΣ3Σ2

  • 内の文字列という内の文字列として符号化されるべきですΣ2Σ1

したがって、とに選択肢がないことをと、質問は次のように理解する必要があります:「モールス全体の構造と特性を最もよく説明するために、中間アルファベット考慮すべきシンボルの数コード、 "また、3つのレベル間で2つのエンコードを指定する必要があります。Σ1Σ3Σ2

モールス符号であるという事実、所与のプレフィックス信号を復号する際に排除いかなる曖昧さは、我々はAで単にこの本質的な性質を説明することができることを準同型(可変長)符号三元アルファベット { 、、}、および2つの符号化方式から に、及びからへ準同型プレフィックス、従って両方の明確なコード、及び明白な接頭辞を与えるように構成することがすることができるともに、 58個のシンボルをバイナリにエンコードします。Σ2=dotdashsepC32Σ3Σ2C21Σ2Σ1

したがってモールスコードはアルファベットで表現さ接頭三元コードで構成されている 、、自体はバイナリで符号化されたこれら3つのシンボルを用いて、次のコードワードを有します。{ dotdashsep }

dot 10、、およびdash 1110sep 00

何が連続との間の空間として知られていることに注意してくださいdot、またはdash実際の表現に含まれているdotdash、これは通常、ターゲット記号で表さコードワードにソースシンボルから文字列準同型として定義されているコードのようなタイプの通常の数学的表現であるように、私がやったように。

これは、構造特性を分析するのではなく、ユーザーにコードを直感的に指定することを目的とした、標準で提供されているプレゼンテーションの一部から少し外れています。ただし、エンコーディングはどちらの場合も同じです。

標準の正確なタイミングがなくても、アナログ信号のデコーダーは、提案された3進アルファベットに変換することができます。そのため、上記の3進コードの理解は依然として有効です。

コード:基本的なポイント

この回答は、2009年10月付けの標準ITU-R M.1677-1に基づいています(参考としてJason Cに感謝します)。私は専門用語を使用しなければならないdotdash、というよりも、ditそしてdahそれは、この規格で使用される用語であるとして、。

モールス信号の議論を始める前に、コードが何であるかについて合意する必要があります。この質問に関する難しい議論には明らかにそれが必要です。

基本的に、情報を送信または処理するには、情報を表す必要があります。コードは情報をある表現システムから別のシステムに翻訳するシステムです。これは非常に一般的な定義です。私たちは、の概念と混同しないように注意しなければならない表現を、とのコード 1つの表現(からソース別)(ターゲット)。

表現は、可変電圧、紙上の色付きドット、文字列、数字、0と1のバイナリ文字列など、多くの形式をとることができます。アナログ表現と形式的(または論理的、または抽象的)表現を区別することが重要です。

アナログ/物理表現は、図面、さまざまな電圧レベル、形状(文字の場合)です。

論理的/形式的/抽象的表現は、抽象的なグラフ、記号の文字列、またはその他の数学的エンティティを含む数学的表現です。

一部の情報は元々アナログである場合がありますが、通常、その処理を数学的な手段または人によって正確に定義できるように、論理的な表現に変換します。

逆に、コンピューターやトランスミッターなどの物理デバイスを使用して論理表現を扱う場合、論理表現にアナログ形式を与える必要があります。

この分析のために、標準で説明されているように、我々が検討する唯一のアナログ形式は送信に使用される形式です。しかし、それでも、最初のステップは、このアナログ表現をまったく同じ構造の論理表現の直接の実装として解釈することであり、その上でモールス符号がどのようなコードであるかの分析を構築することだと考えます。コード理論は、論理表現の分析に基づいた数学的知識体系です。

ただし、最後の議論でアナログ/論理の移行に戻ります。

コード:定義

論理的な見方では、ソースアルファベットソース文字列をターゲットアルファベットに変換するためにコードが使用されるということです。多くの場合、目的が情報の表現に特別なプロパティを追加すること(エラーに対する耐性を高める(エラーの検出と修正)や表現を小さくするなど)ために、両方のアルファベットが同一(通常はバイナリ)である場合です。冗長性の削除(ロスレスコード圧縮)、および場合によっては慎重に制御された一部の情報の損失(損失のある圧縮)。ST

ただし、モールス符号の目的は、大きなアルファベットの文字列を、はるかに小さなアルファベット(実際にはバイナリ)に基づいた文字列に表現する方法を提供することです。知覚と操作能力。これは、可変長コードと呼ばれるものによって実現され ます

正式な言語理論の用語を使用すると、正確な数学的定義は次のようになりますと、それぞれソースアルファベットとターゲットアルファベットと呼ばれる2つの有限集合とします。コードからの各シンボルマッピング合計関数である上の記号のシーケンスに、および拡張の準同型に に、天然の各シーケンスをマッピングターゲットシンボルのシーケンスへのソースシンボルは、その拡張子と呼ばれます。STC:STSTCST

コードワードをシンボルのイメージと呼びます。C(s)TsS

可変長符号ある一意に復号可能なの対応する準同型場合にである単射。つまり、任意の文字列は、最大1つの文字列のイメージになります。また、コードは明確であると言います。つまり、どんな文字列でも、明確にデコードできるということです。CSTTS

可変長コードは、他のコードワードのプレフィックスであるコードワードがない場合、プレフィックスコードです。それはまた、即時コード、またはコンテキストフリーのコードです。これらの名前の理由は、プレフィックスコードのコードワードで始まるターゲット文字列を読み取るときに、次のシンボルを知らない/読み取る必要なく、最後のシンボルを読み取るとすぐにコードワードの終わりを認識するためです。結果として、プレフィックスコードは明確であり、高速で非常に簡単にデコードできます。w

一意のデコード可能性とプレフィックスプロパティがコードの構成の下で閉じられていることが簡単にわかります。

準同型としての定義は、コードワード間に特別な分離がないことを意味すること注意してくださいそれらを明確に識別することができるのは、プレフィックスプロパティなどの構造です。

実際、そのような分離記号がある場合、ターゲットアルファベットから文字列をデコードする必要があるため、それらはターゲットアルファベットの一部である必要があります。次に、先行するコードワードにセパレータを追加することにより、可変長コードの理論モデルに戻すのは非常に簡単です。それがコンテキストの難しさ(たとえば、複数のセパレーターによる)を引き起こす場合、それはコードが見かけよりも複雑であることのヒントにすぎません。これは、上記の理論モデルに固執する正当な理由です。

モールス信号

モールス符号は、標準で3つのレベルで説明されています。

  • 3。57文字(27文字、10桁、20の記号と句読点)と単語間スペースを使用して、文字列を単語に切り分ける自然言語テキストのエンコードを提供することを目的としています。単語間スペースは特殊文字のように使用され、他の文字と混ぜることができますSEP

  • 2。これらの文字はすべての承継としてエンコードされるdashdot、私は注意しなければならインター文字のスペースを、使用してsep分離すること、dashおよびdot次の文字のものの中から1つの文字のを。

  • 1 dashそしてdot、同様にsep正確一部受け入れユニットの観点で定義された長さを有する信号又は信号(と呼ばれる間隔)の不在として符号化されるべきです。特に、 文字のエンコードdashdotエンコードは要素間スペースで区切る必要がありますσ

これにはすでにいくつかの結論が必要です。

アナログ形式で送受信されるメッセージは連続した長さの単位(スペースの長さまたは時間の長さ)であるため、付録1のパートIのセクションで指定されているように、各単位の期間全体で信号がオンまたはオフになります標準の 2 :

2   Spacing and length of the signals
2.1 A dash is equal to three dots.
2.2 The space between the signals forming the same letter is equal to one dot.
2.3 The space between two letters is equal to three dots.
2.4 The space between two words is equal to seven dots.

これは明らかにビットストリームと呼ばれるもののアナログエンコーディングであり、アナログのオフオンを表す0ansの文字列によってバイナリ表記で論理的に表すことができます。1

アナログ表現に関連する抽象離れて問題にするために、我々は、このように我々が注意しなければならことを、モールス信号のメッセージがビット列として送信されていることを考慮することができます01

したがって、標準からの上記の抜粋は、論理的に次のように表現できます。

  • 0。A dotはで表され1ます。
  • 1 A dashはで表され111ます。
  • 2。要素間スペースσはで表され0ます。
  • 3。文字間スペースsepはで表され000ます。
  • 4。単語間スペースSEPはで表され0000000ます。

したがって、モールス符号は、これらの5つのシンボルをエンコードするためにバイナリで5つのコードワードを使用していると見ることができます。これがシステムの記述方法ではないという事実を除けば、システムにはさらにいくつかの方法があり、単純または数学的な観点から考えると、これは最も便利な方法ではありません。

また、この説明はコード理論の専門家ではなく、素人向けであることにも注意してください。そのため、それを正当化する内部構造よりも目に見える外観について説明しています。コードのプロパティを強調するために、数学的にはより構造化されていますが、この説明と互換性のある他の説明を除外する理由はありません。

しかし、最初に、コードの完全な説明には、すぐに認識できる3つのレベルの表現が含まれることに注意する必要があります。

  • 3。を含む文字列で構成されるテキストSEP
  • 2。dotdashおよびの文字列としての文字列のエンコードsep
  • 1 これら3つのレベル2文字列をsymbolsバイナリ文字列としてエンコードします。

どのシンボルが何にエンコードされているかについてはおそらく議論するかもしれませんが、モールス符号の本質的な側面は、上部に文字があり、中央にdotsとdashesがあり、ビット01下部に3つのレベルの表現があることです。

これは、レベル3からレベル2まで、およびレベル2からレベル1までの2つのコードが必ず存在することを意味します。

表現の3つのレベルの分析

この3層コーディングシステムの一貫した分析を行うために、各レベルでどのような情報が関連するかを最初に分析する必要があります。

  • 1 ビット列は、定義により、そのアナログ表現の必要性によって、のみから構成されている01

  • 3。テキストレベルでは、57文字と単語間スペースを含む58シンボルのアルファベットが必要SEPです。58個すべてが最終的にバイナリエンコーディングを使用する必要があります。しかし、モールス符号標準ではこれらの57 + 1文字が指定されていますが、情報のエンコードにどのように使用されるべきかは指定されていません。それが英語と他の自然言語の役割です。モールス信号は、他のシステムに58シンボルのアルファベットを提供し、その上で58進コードを作成できますが、モールス符号自体は58進コードではありません。

  • 2。で、dotかつdash、すべての我々の必要性は57の文字コードするために、これら二つのシンボルであるレベル、すなわちの文字列としてそれぞれのコードワードを提供dotし、dash一緒にいくつかのセパレータを、sep1つの文字が終了したマークに、そして別のスタート。単語間スペースをエンコードする手段も必要SEPです。leavel 1で直接提供しようとするかもしれませんが、これは、そうでなければ層構造のコードの組織を台無しにします。

確かに、標準の説明はまさにそれを行うために正しく批判されるかもしれません。しかし、著者は、平均的なユーザーにとって、プレゼンテーションの方が簡単に把握できると考えているかもしれません。また、この種の数学的分析に先行するモールス符号の伝統的な記述に従います。

これにはいくつかの注意が必要です。

  • レベル3の文字レベルでは、文字間のスペースsepはもはや意味がありません。文字の世界では、紙に書かれた2つの文字を区切るスペース以上の意味はないため、これは非常に正常です。レベル2では、文字を表すコードワードを認識する必要がありますが、それだけです。

  • レベル2でも同様に、要素間スペースσはもはや意味を持ちません。dotand の世界では意味dashがありませんが、レベル1 dotでは、を表すバイナリコードワードを識別するためにのみ必要dashです。ただし、レベル1では、ビットと区別できません0

したがって、要素間スペースσはもはや特別なものではありません。これはの1つの使用法です0

ただし、前に説明したように、可変長コードの知識を使用してコードを分析する場合は、コードを単純な文字列として定義するために、後続のコードワードにセパレータを追加する必要があります準同型。Σ2Σ1

これは、次のコードの部分的な指定を意味します: およびdot10dash1110

レベル2のアルファベットは、少なくとも1つの他の記号が必要です。文字間のスペースは、標準の文字に従う必要があります。ただし、可変長コードを準同型として定義するには、およびの 各コードワードに要素間スペースを追加する必要がありました。したがって、我々は持っている必要がありますのためのコードワードとしてそうtoghether終わるとその、先行からか、それは3になり、標準で必要とされます。これは常に機能します。なぜなら、標準には、2つの文字間セパレータが互いに続くという規定がないためです。Σ2sep0000dotdash00sep0dotdash0

これは、符号化するのに十分であるアルファベット { 、、}準同型コードと以下のように定義されます:Σ2=dotdashsepC21:Σ2Σ1

  • dot10

  • dash1110

  • sep00

そして、コードワードが他のコードワードの接頭辞ではないことを発見したことには大きな驚きがあります。そのため、明確で解読しやすいプレフィックスコードがあります。

コードを定義するために、同様に進めることができます。C32:Σ3Σ2

標準では、たとえば文字を表す ために標準の表で指定されている方法で、の文字のコードワードdotとしてとの文字列を使用します。dashΣ3dot dot dash dotf

繰り返しますが、これらのコードワードは文字間スペースで区切られています。コードを準同型写像として定義するには、コードワードにセパレータを含める必要があります。そのため、準同型写像の定義は次のようになります f dot dot dash dot sep

これは、アルファベット 57文字のそれぞれに適用されます。しかし、ここでもまた、単語separatorが必要です。これは、標準に従って、です。最初に、既に3ビットがコードによって提供され、2 が単語の最後の文字を終了するビットによって提供され、1 がその最後の文字の最後またはエンコードを終了するビットによって提供されることに注意してください。したがって、最終的に残りとしてコーディングする必要があります。Σ3SEP00000000sep0dotdashSEP0000

ただし、階層型アプローチを尊重するには、SEPコードワードでエンコードする必要があります。以来ようバイナリエンコードされ、それが従うように符号化することができます。Σ2sep00SEPsep sep

したがって、アルファベットを準同型コードエンコードでき ます は次のように定義されます。Σ3={A,B,,Z,0,1,,9,?,=,,×,@, SEP}C32:Σ3Σ2

  • A dot dash se p

  • B dash do t dot dot sep ...

  • Z dash dash dot dot sep ...

  • 7 dash dash dot dot dot sep ...
  • SEP sep sep (単語の区切り用)

また、別のコードワードが別のコードワードのプレフィックスではないことがわかると、さらに驚きます。したがって、コードもプレフィックスコードです。C32

プレフィックスプロパティはコードの構成の下で閉じられるため、モールス信号はプレフィックスコードです。CMorse=C21C32

そこで我々は、と結論付けることができる3つのシンボルアルファベットの接頭バイナリエンコーディングの組成物として、{、モールスコードが理解され、容易に分析することができdotdashsep57羽の文字(}バイナリアルファベットに、58シンボルアルファベットの接頭符号化3文字のアルファベットに1つのスペース)。

コンポジション自体は、58個のシンボルをバイナリ表現にエンコードするプレフィックスです。

この分析に関するコメント。

構造のプレゼンテーションが思いつく最高のものであることを確立することは常に困難です。ただし、上記の分析は、この回答の冒頭で設定された基準を満たしているようです。現在のコーディング理論に従って正式に提示された3層の定義に近いこと、シンプルさ、コードの主要な特性を証明します。

エラー修正プロパティを探す意味はほとんどありません。モールス符号は、2つdotを1 つに変更するだけなので、シングルビットエラーを検出することさえできませんdash。ただし、ローカルエラーのみが発生します。

圧縮に関して、三値エンコーディングは、近似的な種類のハフマンコーディングで、ドットとダッシュの数をほぼ減らすように設計されました。しかし、2つの合成コードは簡単に密度を上げることができます。

アルファベットのサイズに関しては、バイナリおよび58シンボルのアルファベットを選択することはできません。中間アルファベットにはさらに記号を含めることができますが、目的は何でしょうか?

ただし、一部の人々はDETレベル2でスペースを認識し、アルファベット4進を作成し、それをレベル2でそれ自体としてエンコードされたレベル3で直接使用します。

これはDET、バイナリとしてとしてエンコードされるため、標準定義を満たし0000ます。ただし、のプレフィックスコードとしてのバイナリエンコードの分析が妨げられ、 がプレフィックスコードであることを示すのが難しくなり 、明確になります。 C M O R S EC21CMorse

実際、このような選択により、バイナリ文字列が0000あいまいになり、どちらかSEPまたはとしてデコード可能になりますsep sep。曖昧さはsep、それ自体には従えない文脈上のルールで解決する必要があり、形式化はより複雑になります。

アナログから論理への移行の重要性。

この分析は、オン/オフ信号の等しい長さの単位への分解が、バイナリ文字列のアナログ表現を明確に示しているという事実に大きく依存しています。さらに、単位での長さは上記の分析に正確であり、偶然に発生した可能性は低いと思われます(可能ですが)。

しかし、元の特許1647を(あまりにも大雑把に)見てみると、次のような文(2ページの先頭)ではそれほど正確ではなかったようです。

明確な数字、または単語や数字の文で使用される複合数字の記号は、そのような明確な数字を構成する文字の分離に使用される距離よりも大きい範囲の文字間の距離または間隔のスペースで構成されますまたは複合数字。

後で手で送信したり、耳で受信したりする人も、それほど正確ではありませんでした。確かに、彼らの、すなわち彼らのタイミングはしばしば認識可能でした。このビューは、特にモールス信号を学習する場合、間隔の長さが常に尊重されるわけではないという事実によってもサポートされています。

これらの状況は、短い信号(ドット)、中程度の信号(ダッシュ)、短い、中程度、長い休止としてのコードのアナログ表示に対応しています。論理アルファベットへの直接転置は当然、58のシンボルをコード化する必要のある5 アルファベットを与えます。もちろん、これはもはやモールス信号の3層プレゼンテーションではありません。

ただし、意味を理解する(および場合によってはあいまいさを避ける)ために、このアルファベットは、2つのシグナルシンボル(dotまたはdash)が互いに追従できず、ポーズシンボルも互いに追従できないという制約とともに使用する必要があります。コードとそのプロパティの分析はより複雑になり、それを簡素化する自然な方法は、行われたことを行うことです:適切なタイミングを導入して2つのコードの構成に変換し、上記のかなり単純な分析につながります(コードがプレフィックスであることを示すことを忘れないでください)。

さらに、アナログ表現の正確なタイミングに従う必要はありません。アナログ変換のデコーダーは、短い、中程度、長い一時停止をどのような手段によっても区別できるため、バイナリの場合に行われたことを模倣する必要があります。したがって、短い信号と中程度の信号(必然的に一時停止が続く)は、論理的dotまたはとして認識されdashます。dotまたはの終わりを示すためだけに役立つため、短い一時停止は忘れられdashます。中ポーズはとして認識されsep、長いポーズはsep連続して2として認識されます。したがって、アナログ信号は3進数のアルファベットで表され、58シンボルのアルファベットをエンコードするために以前と同様に使用できます。タイミングが厳密に尊重されていない場合でも、初期分析を使用できます。

あるいは、信号休止交互を使用して、この5進アルファベットを3進アルファベットに変換し、3つの持続時間のみをアルファベットのシンボルとして保持し、コンテキスト分析を使用して、所定の持続時間が信号か休止かを判断できます。しかし、これも分析するのが少し複雑です。

これは、物事を見る方法がたくさんあることを示していますが、必ずしも便利ではなく、コードを分析するために開発された数学ツールを使用した分析にすべてが容易に役立つとは限りません。

特許へのより多くの参照はインターネットで見つけることができます。

結論

標準の正確なタイミングを考えると、モールス符号を、これらの3つのシンボルのバイナリプレフィックスエンコーディングで構成された3つのシンボルアルファベットへの3進数のプレフィックスエンコード(58文字)の構成として考えるのが良いようです。

標準の正確なタイミングがなければ、バイナリレベルを考慮することはできません。次いで、論理復号化アナログは、天然中間体のアルファベットのレベルで行われるdotdash。ただし、アナログから論理デコーダーは、前の3つのシンボルアルファベットにデコードできるため、分析の適用性が維持されます。


1
それ以上の会話を移動してくださいchat.stackexchange.com/rooms/21638/...
さすらいのロジック

1
コメントは詳細なディスカッション用ではありません。この会話はチャットに移動さました
ラファエル

質問:三項引数では、アルファベット{0,1}で始まり、これから4つのシンボル{dot = 10、dash = 1110、sep1 = 00、sep2 = 000000}を作成し、これから三項コードワードセットを作成しますsep2 = sep1 sep1 sep1を許可します。コードワードセットが選択されたのは、暗黙的にシンボルをエンコードに結び付けるためです。これは便利であり、OPはバイナリストレージについて尋ねています。ただし、代わりにコードワードセット{rest = 0、on = 1}を使用して、「dot = on」、「dash = on on on」、sep0 = "off"、sep1 = "off off off"と言うことはできません。 、sep2 = "off off off off off off off"(sep0は信号間休憩)?
ジェイソンC

^この場合、引数は、3進数に設定されたバイナリコードワードに対するものですが、ここで指定された3進数と同様の強力な引数を使用します。つまり、行の複数の区切り文字に特別な意味を与えるが、行の複数のその他には特別な意味を与えないという選択は、三項引数の基本ですが、任意のようにも見えます。
ジェイソンC


28

この答えは見た目ほど長くはありません。このサイトでは、リストアイテム間に多くの間隔を空けています。更新:実際にはかなり長くなっています...

モールス符号は、「公式に」バイナリ、3進、4進、5進、または57進(正確に数えれば)ではありません。文脈のないものについて議論することは生産的ではありません。それは、最大であるあなた、それがされ、それらの5のどの定義するために、アプリケーションや特定の状況の符号化要件に基づいて。そのためには、各シンボルセットのサイズに長所と短所があります。決定を下す前に、状況を考慮してください。

基礎として、国際モールス信号規格のセクション2 であるM.1677は、タイミングを次のように定義しています。

2信号の間隔と長さ
2.1ダッシュは3ドットに等しい。
2.2同じ文字を形成する信号間のスペースは1ドットに等しい。
2.3 2つの文字間のスペースは3つのドットに等しい。
2.4 2つの単語間のスペースは7ドットに等しい。

これはタイミングのみを定義することに注意してください。たとえば、ダッシュは3つのドットと同じものではなく、単に同じ長さです。時間の基本単位はドットです。


バイナリ

必要に応じてバイナリを選択できます。モールス信号を「厳密なバイナリ」と呼ぶこともできます。著者のアプローチは、数字を「ドット」と「ダッシュ」に割り当てることでした。そのアプローチは機能せず、著者がモールス信号をしっかりと把握しているとは思わない。しかし、機能する別のアプローチがあります。バイナリを選択する場合、基本的に信号がハイかローかを表し、各シンボルは単一のドット長のタイムスライスを占有します。これは、引用したバイナリコードのリストページで説明されているアプローチでもあることに注意してください。

他のバイナリコーディングも選択できます(例:Bob Jarvisの回答)。音声モールス符号へのデコードの難易度が増加します(ボブのエンコードはステートレスにデコードできません。たとえば、短いエンコードシーケンスを提供するトレードオフです)。

記号:

  • 低、オフなど(0)
  • 高、オンなど(1)

エンコードの例:

  • シグナルセパレータ:0
  • 文字区切り:000
  • 単語区切り:0000000
  • 3つのドット:10101
  • 3つのダッシュ:11101110111
  • 「息子」という言葉:101010001110111011100011101
  • フレーズ「is a」:10100010101000000010111

長所:

  • 最小シンボルセットサイズ
  • 一般的なデジタルロジックで簡単に管理
  • 可聴モールス信号に簡単にデコードできます(検証が行われないと仮定)。ステートレスデコード。シンボルのタイミングに関する情報を保存する必要はありません(各シンボルは同じ長さです)。

短所:

  • 長いエンコード。
  • 無効なエンコーディングの多くの機会。
  • 個々のシンボルの意味(0、1)はコンテキストに依存します。


三元系

この選択により、文字と単語の間隔を休符として定義し、信号間隔は暗黙的です(ただし、より適切な場合は、信号間にドット長の休符記号を要求することもできます)。

記号:

  • ドット長の休憩(0)
  • ドット(1)
  • ダッシュ(2)

エンコードの例:

  • 文字区切り:000
  • 単語区切り:0000000
  • 3つのドット:111
  • 3つのダッシュ:222
  • 「息子」という言葉:11100022200021
  • フレーズ「is a」:11000111000000012

長所:

  • 小さいシンボルセットサイズ。
  • シグナルセパレータは不要になりました。
  • バイナリよりも短いエンコード長。
  • 無効なエンコーディングをいくつか削除します(たとえば、バイナリ選択が不可能な0110など)。

短所:

  • まだ長いエンコーディング。
  • エンコードの無効化の可能性、特に残りの部分。
  • ステートレスにデコードすることはできません信号間に明示的なドット長の休符を配置することを選択しない限り。
  • 信号分離器は暗黙的ですあなたは信号間の明示的なドットの長さの休符を配置することを選択した場合を除きます。
  • 一部の個々のシンボルの意味(0)は、コンテキストに依存します。


第四紀

記号:

  • 文字区切り(0)
  • 単語区切り(1)
  • ドット(2)
  • ダッシュ(3)

エンコードの例:

  • 3つのドット:222
  • 3つのダッシュ:333
  • 「息子」という言葉:2220333032
  • フレーズ「is a」:220222123

長所:

  • 非常に短いエンコード長。
  • 無効なエンコーディングの可能性が減少します。
  • 記号は意味的に正確です。
  • 間違いなく、より人間が読みやすい。

短所:

  • 大きなシンボルセットサイズ。
  • ステートレスにデコードできません。
  • シグナルセパレータは暗黙的です。


五分

ウィキペディアのリストの直接的な解釈。これは、バイナリ0または1のさまざまな有効な組み合わせに独自のシンボルが与えられることを除いて、バイナリ選択に非常に似ていることに注意してください。

記号:

  • シグナルセパレーター(0)
  • 文字区切り(1)
  • 単語区切り(2)
  • ドット(3)
  • ダッシュ(4)

エンコードの例:

  • 3つのドット:30303
  • 3つのダッシュ:40404
  • 「息子」という言葉:303031404041403
  • フレーズ「is a」:3031303032304

長所(第4四半期と比較):

  • ステートレスにデコードできます。
  • 標準のセクション2で言及されている5つのオブジェクトを明確かつ直接的かつ簡潔に表す唯一のシンボルセットサイズ:「ドット」(すべてのタイミングが相対的)、「ダッシュ」、「信号間のスペース」、「間のスペース」 「2文字」、「2つの単語間のスペース」。

短所(第4四半期と比較):

  • 無効なエンコードの可能性が高くなります。
  • 余分な情報を追加せずにエンコードの長さを増やします(トレードオフはデコードの容易さです)。
  • ないとして、バイナリの選択肢として解読しやすい、という点で、各シンボルは、時間の異なる長さであり、この関連はどこかを維持しなければなりません。


57-ary:

完全を期すために含まれています。

記号:

  • 26文字
  • 10個の数字
  • 20個の句読点とその他の記号
  • ワードセパレーター(スペース)

エンコードの例:

  • 「息子」という言葉: son
  • 「is a」というフレーズ: is a

長所:

  • 最短エンコード
  • 人間が読める
  • 無効なエンコードは不可能です。

短所:

  • 最大のシンボルセット
  • モールス信号にデコードするのが難しい。各シンボルのモールス信号出力シーケンスのテーブルを維持するために必要であり、単語の境界と隣接する文字を検出してさまざまな休符を挿入する場所を決定する必要があります。
  • 新しいシンボルを追加せずにモールス符号仕様を超えて拡張することはできません(無効なエンコーディングの影響を受けないというトレードオフ)。
  • シグナルと文字の区切りは暗黙的です。

終了

デバイス上のシンボルストリームとして保存する必要がある場合、M.1677がメッセージと送信の終了シーケンスを定義していることに注意してください。パートIIから:

5すべての電文は、クロス信号で終了しなければならない(。 - 。 - 。)
6送信の終了は、クロス信号によって示さなければならない(。 - 。 - 。)、続いて送信する招待信号K( - - )
7作業の終了は、最後の電報を送信したステーションによって示されます。正しい指示は、作業終了信号です(。。。–。–)

残念ながら、標準では、たとえば文字列「+ K」とシーケンス(電報の終わり送信への招待)を区別する機能については言及されていません。ただし、作業終了は一意です。モールス信号を保存する場合、保存されたシーケンスの終わりを示す方法を選択する必要があります。

たとえば、会話全体を保存し、バイナリシンボルセットを使用している場合、作業終了は、一意のビットシーケンス101010111010111として表されるシーケンス終了インジケータであると合理的に考えることができます。タイプを検討する必要があります。決定する前に、保存するデータ(メッセージフラグメント、メッセージ全体、会話全体など)のほか、ストレージメディアによって提供される機能(メッセージの長さをプレフィックスする機能など)。シーケンス終了インジケータを独自に定義することができると思います。いずれにせよ、これらはすべて基礎となるストレージの問題であり、ここにリストするには多すぎる可能性があります。あなたの状況に適切なものに基づいて、選択は本当にあなた次第です。


ステートレスにデコードできない:これらのエンコーディングでは、可聴モールス信号にデコードするために、何らかの状態を維持する必要があります。それらはすべて「前のシンボルがドット/ダッシュであり、現在のシンボルがドット/ダッシュである場合、信号セパレーターを挿入する」必要があります。M.1677 afaictは、単語区切り記号を5つの休符に、文字区切り記号を1に減らしながら、すべてのシンボルにシグナルセパレーターを「チート」して自動的に追加できますが、連続した単語区切り記号を明示的に禁止することはありません。

シグナルセパレーターは暗黙的です。これは上記のノートに直接関連していますが、より意味的に指向されています。これらのエンコーディングには、表記に暗黙的な信号セパレータが含まれています。つまり、「zzz」は直感的に3つの独立したzであり、エンコーディング自体のシンボルを分離するものは何でも「ピギーバック」されます。「3つのドットが連続して並んでいる」という説明を検討してください。直感的に、これは3つの別個のドットですが、セパレータが暗示されていない場合、これはダッシュと区別できないと見なされる可能性があります。Wikipediaスタイルのバイナリおよび5進数(または明示的な信号分離オプションを使用した3進数)表現のみが、ここですべてのあいまいさと「ショートカット」を削除します。これは状況によっては非常に価値があります。このため、5進法の選択に強い議論があります。


TL; DR:

ご覧のとおり、それぞれに長所と短所があり、要件に基づいてどのように処理するかを決定するのはユーザー次第です。正解はありません。一般的に一方が他方よりも適切であると主張することはできますが、文脈がないと正しい答えが得られないため、これらの議論は退屈な好みに要約されます。

さて、私自身の意見では、5つ目の選択は、モールス符号自体(私はもともと4級を好んでいました)にとって私にとって最も「正しい」と感じる表現です。以下のすべてを提供する唯一の選択肢です。

  • コンテキストフリーシンボル(シンボル自体には、隣接するシンボルを調べることなく、その意味に関するすべての情報が含まれます)。
  • M.1667で定義されているすべてのプリミティブの表現。
  • 区切り記号(信号、文字、単語)は、表記法や基礎となるエンコーディングによって暗示されません(これは重要です。私が書いた場合{ dot, dot, dash }、これらは重要で,見過ごされやすいです)。

ただし、すべてに強い議論があります。エンコードに関連する引数は、モールス自体の処理にも適用できます。100%の具体的な答えはありませんが、それは確かにバーであなたの友人との議論のための良いトピックを作ることができます。

。。。–。–


1
それ以上の会話を移動してくださいchat.stackexchange.com/rooms/21638/...
さすらいのロジック

1
コメントは詳細なディスカッション用ではありません。この会話はチャットに移動さました
ラファエル

引数でステートレスデコードを参照し続けます。コーディング理論では、エラー訂正コードのファミリーである畳み込みコードでは、状態はほとんど使用されないようです。モールス信号はエラー修正以外の何物でもないので、これは完全にトピックから外れています。実際、修正することはもちろんのこと、1ビットのエラーを検出することさえできません。さまざまな種類の任意のコードをモールス信号のバージョンであると考えますが、理解することはできません。なぜそれらを提示するのですか?状態を必要としない、つまり準同型のエンコードは、最小要件のようです。そして、あなたは興味深いエンコーディングを見逃しています。cc @KorayTugay
babou

@babou Statlessデコード引数?
コライトゥゲイ

@babouいくつかのトピック外のポイントを持つことを気にしません。もちろん、シンボルセットは任意です。それがまさにこの答えで私が述べているポイントです。バイナリプレフィックスコード引数の上部に設定される3進ワードは、同様に任意です。一見、基本的には、2文字のアルファベット(0と1)を含むコードワードセットに基づいて引数を選択するために、任意の選択を行いました。「sep sep sep」に特別な意味を与えるが「unit 1」にはそれを行わないという選択は任意であるため、これは任意の選択です。「ダッシュ」は「ドットドットドット」であると簡単に言うことができ、バイナリオーバーターナリーを主張できます。
ジェイソンC

5

これについての私の最初の考えにもかかわらず、この質問はかなり正確な答えを認める方法で形式化できることがわかりました(いくつかの定義の問題を修正)。答えは3または4、つまり3進または4進です。群衆を喜ばせる「すべてが2から57に行く」という答えは、誰かがアーベルのグループの特性化を求めた場合、あなたはそれらがセットであることを彼に伝えるという意味でのみ正しい。

まず、モールス信号の物理エンコーディングを見てみましょう。これは実際にはB ASK、つまりバイナリ振幅シフトキーイングです。これは、メッセージをエンコードするための2つの物理的(電気的/光学的など)の振幅レベルを示す精巧な方法です。したがって、差し迫った質問は、モールス符号がバイナリであるということを意味するのではないでしょうか?まあ、それはかなり有益ではない方法でのみバイナリであり、ワイヤーを介して送信されたバイナリのオン/オフ信号はラインまたはドットに直接対応しないという意味で。このあいまいなレベルの通信では、ASCIIコード(直接の明白なビットエンコーディングを使用)を送信し、「モールス」または「バイナリ」と呼ぶこともできます。同じことが、ハフマンコード(ASCIIの代わり)にも当てはまります。

では、どのようにして対応をより正確にし、同時に質問を形式化できますか?コーディング理論が役立ちます。レッツ私が正しくモールス信号の宇宙を理解していれば「morsable」のシンボル、およそ66シンボルの集合です。これには、26個のラテン文字、0〜9桁の数字、句読点、「予兆」などの付属物が含まれます。実際、これらが何であるかはそれほど重要ではありません。コードは単射マッピング で、(はない)はコードワードのセットです。基礎となるBASKハードウェアで物理的に表現できるようにするには、が必要です。つまり、コードワードはビットの文字列である必要があります。これは伴うことに注意してくださいC M T * T T * T { 0 1 } * CMc:MTTTT{0,1}cの値はコードワードの文字列であるため、ビット文字列の文字列ですが、最終的には単なるビット文字列として線形化されます。

モールス信号の忠実な特性化を行うには、これらのコードワードと紙上のモールス信号を表すドットとラインの間に全単射がなければならないという意味で、にラインとドットの直接的な同等物を含める必要があります。は、[ほぼ]一意に解読可能なコードである必要もあります。つまり、の要素/コードワードに関する要素のファクタリングは[理想的には]一意である必要があります。(一部の著者、たとえばことを注意Berstelが、でも呼び出すことはありません、それが一意に解読されない限り、コードが、その他、例えばスティーブ・ローマンT T T TTTTTTマッピングがコードであるという異なる用語がありますが、一意に解読可能なものはそのように言われ、UDコードを省略します。ここでは、後者の用語のみを取り上げます。また、「理想的」と言った理由についても後で説明します。

以来唯一の注射ではなく全射であることが必要であり、我々は読み込むことができますこのジャンクによって生成された文字列が何もmorsableのプレイメージではない限り、UDコードを取得するために必要なものを超えた任意の「ジャンク」と。たとえば、正確に42個のドットの文字列は、私が見たモールス信号のバリアントのいずれにも対応していません。したがって、モールス符号のバイナリ、3進、4進、5進などを尋ねる場合、上記の2つのプロパティを持つの最小カーディナリティを求める必要があります。つまり、[ほぼ] UDコードであり、いくつかの要素に対する紙ベースの「線」と「ドット」の間の明らかな全単射。T T TcTTT

構築を進めるには、UDコードを取得するためにモールス文字の紙ベースのラインドット表現の間にセパレーターが必要であることを観察することによるトップダウン、またはITU以来のボトムアップの2つの方法があります国際モールス符号では、線、点、およびさまざまな一時停止の時間の長さが与えられます。を取得する方法は多数あるため、後者のアプローチを使用します。つまり、かなり不定の時間長を選択できます。たとえば、古いアメリカンモールス符号はITUバージョンよりも短い行を使用します。TTT

単位長の「オン」信号(1)と「オフ」信号(0)から生成される5つの基本コードワードを持つITU信号長派生表現から始めましょう。just-dot(1)、just-line(111)、unit-space(0) 、letter-space(000)、word-space[International Morseでは7つの0を想定していますが、実際には異なる場合があります]。ことをすぐにノートunit-spaceにのみ表示されることが1に続いてのみ直後just-dotjust-line。そして、このの-termination と(カンマコードであり、この後の詳細は)実際にはそうでない場合は必要になるあなたも、ドットから離れて行を伝えることができませんでした。これにより、次の4つのコードワードへの明らかな削減が可能になります。0just-dotjust-line

  • dit= just-dot unit-space= 10および
  • dah= just-line unit-space= 1110。

だから、四モールス信号です:ditdahletter-spaceword-space。次の観察結果は、word-spaceが2 letter-space個、つまり6個のゼロで近似(または推定)できることです。それでは、どのようにして3進コードワードセットを取得しますか。推論のこの行の参照として、例えば[1] [2]を参照してください。

三項コードワードを好む技術的な理由もあります:は一意に解読可能なコードであり、実際はプレフィックスコードです。ただし、(またはゼロが6つだけのバージョン)は、ため、一意に解読できなくなりました -一意の因数分解。これは理論的には問題ですが、人間の「メトロノーム」はとにかく非常に長い無音を測定するのが難しいため、実用的な懸念はありません。したがって、基本的に特定の長さより長い無音は(人間によって)一種であると想定されます。、{ 10 1110 000 0 7 } 0 10 = 0 3 0 7 = 0 7 0 3T={10,1110,000}{10,1110,000,07}010=0307=0703word-space

また、そのセットにを固定すると(つまり、「5進」ビューをとる)、「さらに間違っている」ことになります。つまり、でも一意の因数分解は行われません(それ自体もコードワードです)。また、が迷惑になるように、任意のモールス符号のプレイメージされていない追加できる多くのと同様に、に。実際、後者を追加することは、追加するのとは異なり、コードがUDプロパティを失うことはないため、それほど面倒ではありません。000 0 T 1 42 0 T 000000T1420T0

還元/から引き抜きditdahletter-space3つの抽象記号(トリット)のバイナリコードワードとしては、(三)モールス符号がUDであることを迅速に示すために有用です。それletter-spaceはコンマとして機能するため、つまり、三項モールス信号はコンマコードであるため、すぐに明らかです。(他の著者は、コンマ以外のすべてのシンボルが同じものであるより制限的な意味で「コンマコード」を定義していることに注意してください。ここでは、DHスミスの「ポストモダン代数」与えられるより広い意味でそれを使用しています。これは、コードワードごとに一意の終了記号を使用することを意味します。)また、モールス符号の2つのレベルで、comma0codeテクニックが使用されていることに注意してください。just-lineそしてjust-dot「短いカンマ」で終了しているunit-space=0000それらを互いに区別できるようにします。その構造を2つの異なる(ditおよびdah)トリットに抽象化すると、すべてのモールス符号文字も、3番目のトリットであるで終了することによってコンマコード化されます。000

また、想定トリットアプローチを計算エントロピーを使用することができるdahditletter-spaceトリットとして「同等」である[3]例えば、'Eためにその-2」トリットを受け取り、 『Y』が5つのトリットをとる意味で、。行ごとに実際のBASK Morseエンコーディングで各シンボルを実際に送信するのにどれだけの費用がかかるかを気にする場合、抽象的なトリットアプローチはあまり役に立ちません。後者の場合、3(または4)シンボルの実際のビット長に到達する必要があります。これは、オートマトンの遷移のように見えます。例えば、文字「e」はエンコードするのに5ビット(as dit letter-space)を取り、「y」は17ビット(3 dahs、1 dit、a letter-space)を取ります。この考え方は、シャノン遡ります(3-4ページを参照)。詳細はこちらをご覧くださいBlahutの「Information Theory and Coding」では、例えば、英語での文字発生の(無条件)確率を使用して、モールス符号の「ソース出力文字ごとの平均信号時間9.296単位」を計算します。(動物学者による)わずかに異なる博覧会については、JP Hailmanの記事をご覧ください。彼は英語の文字についてわずかに異なる確率を仮定しているため、彼は異なる平均(10.2)を取得しますが、その他の点では分析は概念的に同じです。

これを要約すると、モールス信号のいくつかの見方をすることができますが、それについて興味深いことを言う点で他の人よりも実り多いものがあります。「5進」ビューを使用した分析を認識していません。このモデルが4つのシンボルに還元されないようにするには、実際のモールス信号では保持されない単位空間の出現についていくつかの仮定を行う必要があります、たとえば、2つの隣接するユニットスペースを持つことができるが、必ずしも3つの隣接するユニットスペースがないこと(これは無効なモールス信号です)。三元表示により、独自のデコード可能性をすばやく分析できます。最も深い/実りの多いビューは、実際のモールス符号(| dit| = 2、| dah| = 4、| letter-space| = 3および|word-space| = 6または7); この低レベルでは、3進/ 4進シンボルをオートマトンの遷移と見なすことは依然として洞察に富んでいます。

なぜウィキペディアがこれを吸うのかについて...いくつかのトピックについては、それがちょうどします。http://en.wikipedia.org/wiki/Coding_theoryにある彼らの主要な記事は、私が読むことをお勧めするものではありません。あなたが言及した(Petzold)本については、情報理論の専門家によって書かれたものではないことを除けば、あまり言えません。Petzoldが正しいのは、モールス符号化されたメッセージが1文字のみで構成されている場合、何らかのバイナリコードであると合理的に言うことができるという意味でのみです。ただし、単語を送信する場合は、文字区切り文字が必要です。そうしないと、コードは恐ろしくUDではなく、実用的ではなくなります。


ここで投稿全体を改訂するのは少し遅れていますが、@ babouは以下のように、シャノン、ブラフトなどが(現在の)ITU標準を誤って解釈していることを明らかにしています。技術性:ユニットスペースは同じ文字のディットとダーletter-space間に追加されますが、文字の間にのみ追加されます。この標準の読み方は、かなり最近の開業医の本に基づいてチェックアウトされているようです。したがってletter-space、それぞれに1つの0を借用する必要がditありdah、それらが文字の終端位置にある場合、2つの0のみを残しますletter-space。つまり、です。また、(たとえば) 'e'のサイズが5ではなく4ビットのみであることも意味します。T={10,1110,00}


それ以上の会話を移動してくださいchat.stackexchange.com/rooms/21638/...
さすらいのロジック

コメントは詳細なディスカッション用ではありません。この会話はチャットに移動さました
ラファエル

-1

当初、モールス信号は一片の紙にマークを書くことを目的としていましたが、電信オペレータはすぐに装置のクリックを「読む」ことができるようになりました。このバージョンのモールス(アメリカまたは「ランド」モールス)には、3つの「マーク」要素、ドット、ダッシュ、および長いダッシュがありました。

前世紀の無線伝送による国際モールスの使用は、通常、手で(電信キーで)エンコードされ、受信機が発するビープ音のパターンを聞いて耳でデコードされました。熟練したオペレーターは、熟練していないオペレーターよりも良い結果を得ることができ、一部の人々は、他のオペレーターよりも理解しやすいコードを作成できました。良い送信オペレーターは「良い拳」を持っていると言われていました。不適切なオペレーターはLIDと呼ばれていました。(「蓋」の起源については、DD、daaahh、dit dit、dah dit dit、dah dit ditの代わりにDD、daaahh、dit dit、dah dit ditのLIDを送信するというアメリカンモールスの一般的なエラーに起因すると信じています-このリファレンスを参照してください:https://english.stackexchange.com/questions/31818/how-did-the-word-lid-come-to-mean-poor-operator-in-the-context-of-telegraph。)

したがって、モールスのバイナリ形式への「エンコード」は目的に依存するため、「良い拳」対「悪い拳」の品質を保持するかどうかになります。一連のオン/オフスイッチングをクロックに一致させ、信号の各部分の位相または期間の問題を「修正」しますか?あるいは、ランダムまたは混乱した変動を保持するのに十分なレートでサンプリングされるのではなく、おそらく後の検査や喜びのために?


1
申し訳ありませんが、これは質問にどのように答えますか?
コライトゥゲイ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.