/ usr / share / dict / wordsの単語はどこから来たのですか?


10

/usr/share/dict/wordsたくさんの言葉が含まれています。このリストはどのように生成されますか?その内容は異なるUnices間で同じですか?何を含める必要があるかを規定する標準はありますか?

私がこれまで確認できたことは、Ubuntu / Debianではリストがワードリストパッケージからのものであるということだけですが、それらの説明では、リストが実際に生成された方法についての手がかりがありません。

回答:


10

あなたは複数の質問をしていますが、主なものは次のとおりです。

何を含める必要があるかを規定する標準はありますか?

私の知る限りではありません。

それを考えると、あなたの関連する質問:

このリストはどのように生成されますか?その内容は異なるUnices間で同じですか?

「それぞれのUnixに依存します」と答えます。

オペレーティングシステムの一部として単語リストを含めるという慣例は、プリミティブスペルチェック手順にそれを使用するspell(1)ユーティリティから来てます。

そのスペルチェック手順は、1982年にベルラボのMDマキロイが作成した学術論文「Developing of a Spelling List」に記載されています。

オペレーティングシステムのパッケージマネージャーをチェックして、スペルリストの取得元、スペルリストの生成方法、および利用可能な代替手段を確認してください。

たとえば、Debian GNU + Linuxの場合:

  • この/usr/share/dict/wordsファイルは、Debianの「代替」システムを使用して管理されるシンボリックリンクです。
  • そのリンクを提供する一般的な単語リストパッケージはwamericanパッケージです。
  • パッケージのドキュメントにwamericanは、その単語リストがSCOWL(スペルチェッカー指向の単語リスト)プロジェクトからのものであると記載されています。

他の多くの単語リストパッケージをインストールできます。それぞれに「Provides:wordlist」フィールドがあります。

$ aptitude search '?provides(wordlist)' | wc -l
34

別のUnicesでは、単語リストの由来と代替案を知るためにパッケージシステムとドキュメントを見る必要があります。


2
FWIW:最小限のCentos 7 x64インストール(wordsファイルが存在しない場合)では、yum install words私にとってはトリックでした。
Wossname
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.