/usr/share/dict/words
たくさんの言葉が含まれています。このリストはどのように生成されますか?その内容は異なるUnices間で同じですか?何を含める必要があるかを規定する標準はありますか?
私がこれまで確認できたことは、Ubuntu / Debianではリストがワードリストパッケージからのものであるということだけですが、それらの説明では、リストが実際に生成された方法についての手がかりがありません。
/usr/share/dict/words
たくさんの言葉が含まれています。このリストはどのように生成されますか?その内容は異なるUnices間で同じですか?何を含める必要があるかを規定する標準はありますか?
私がこれまで確認できたことは、Ubuntu / Debianではリストがワードリストパッケージからのものであるということだけですが、それらの説明では、リストが実際に生成された方法についての手がかりがありません。
回答:
あなたは複数の質問をしていますが、主なものは次のとおりです。
何を含める必要があるかを規定する標準はありますか?
私の知る限りではありません。
それを考えると、あなたの関連する質問:
このリストはどのように生成されますか?その内容は異なるUnices間で同じですか?
「それぞれのUnixに依存します」と答えます。
オペレーティングシステムの一部として単語リストを含めるという慣例は、プリミティブスペルチェック手順にそれを使用するspell(1)
ユーティリティから来ています。
そのスペルチェック手順は、1982年にベルラボのMDマキロイが作成した学術論文「Developing of a Spelling List」に記載されています。
オペレーティングシステムのパッケージマネージャーをチェックして、スペルリストの取得元、スペルリストの生成方法、および利用可能な代替手段を確認してください。
たとえば、Debian GNU + Linuxの場合:
/usr/share/dict/words
ファイルは、Debianの「代替」システムを使用して管理されるシンボリックリンクです。wamerican
パッケージです。wamerican
は、その単語リストがSCOWL(スペルチェッカー指向の単語リスト)プロジェクトからのものであると記載されています。他の多くの単語リストパッケージをインストールできます。それぞれに「Provides:wordlist」フィールドがあります。
$ aptitude search '?provides(wordlist)' | wc -l
34
別のUnicesでは、単語リストの由来と代替案を知るためにパッケージシステムとドキュメントを見る必要があります。
yum install words
私にとってはトリックでした。