タグ付けされた質問 「sort」

テキストファイルやその他のデータの並べ替え(並べ替えユーティリティなど)。

6
すべての単語のテキストファイルの単語出現回数を取得し、出力をソートして出力します
テキストファイルを処理し、単語のすべての出現をカウントし、次のように出力するコマンドがありました。 user@box $˜ magic-command-i-forgot | with grep | and awk | sort ./textfile.txt 66: the 54: and 32: I 16: unix 12: bash 5: internet 3: sh 1: GNU/Linux したがって、1行ずつではなく、単語ごとに検索し、1単語だけでなく、すべての単語に対しても検索します。私はずっと前にインターネットのどこかでそれを見つけましたが、それを見つけたり覚えたりすることはできません。
28 sort 

3
bashスクリプトを使用して文字列+数値と結合した文字列をソートするにはどうすればよいですか?
これは、ソートしたいデータです。しかしsort、数値を文字列に処理し、データは期待どおりにソートされません。 / home / files / profile1 / home / files / profile10 / home / files / profile11 / home / files / profile12 / home / files / profile14 / home / files / profile15 / home / files / profile16 / home / files / profile2 / …

3
ソートがɛ= eと言うのはなぜですか?
ɛ(「ラテン語イプシロン」)は、特定のアフリカの言語で使用される文字で、通常は英語の「bed」で母音を表します。ユニコードでは、U + 025Bとしてエンコードされており、毎日とはまったく異なりeます。 ただし、sort次の場合: eb ed ɛa ɛc sort考慮しɛ、e同等と思われる: ɛa eb ɛc ed 何が起きてる?また、目的のために作成ɛしてe区別する方法はありsortますか?
25 sort  locale  unicode 

2
lsソートで英数字以外の文字が無視されるのはなぜですか?
ファイル名をソートするとき、などのls文字を無視します-,_。ソートにもこれらの文字を使用することを期待していました。 例: touch a1 a2 a-1 a-2 a_1 a_2 a.1 a.2 a,1 a,2 ここでこれらのファイルを表示しますls -1: a1 a_1 a-1 a,1 a.1 a2 a_2 a-2 a,2 a.2 私が期待したのは次のようなものでした: a1 a2 a,1 a,2 a.1 a.2 a_1 a_2 a-1 a-2 つまり、ソート時に英数字以外の文字が考慮されることを期待していました。 誰もこの行動を説明できますか?この動作は標準で義務付けられていますか?または、これはエンコーディングがUTF-8であるためですか? 更新:これはUTF-8ソートに関連しているようです: $ LC_COLLATE=C ls -1 a,1 a,2 a-1 a-2 a.1 a.2 a1 …
25 ls  sort 

3
巨大なファイルに対する「sort -u」のスケーラビリティ
「sort -u」の合理的なスケーラビリティ制限とは何ですか?(「行の長さ」、「行の量」、「ファイルの合計サイズ」の次元で?) 「行数」の次元でこれを超えるファイルに対するUnixの代替手段は何ですか?(もちろん、1つを簡単に実装できますが、標準のLinuxコマンドをほとんど使用せずにできることはあるのでしょうか?)
23 sort 

1
最後の列で数値を並べ替える方法は?
私はこの入力があります: sdkxyosl 1 safkls 2 asdf--asdfasxy_asd 5 dkd8k jasd 29 sdi44sw 43 asasd afsdfs 10 rklyasd 4 この出力が必要です: sdi44sw 43 dkd8k jasd 29 asasd afsdfs 10 asdf--asdfasxy_asd 5 rklyasd 4 safkls 2 sdkxyosl 1 だから私は最後の列で行をソートする必要があります。 1行にいくつの列があるかわかりません。 どうしたらいいか分からない。「perl powers」を持っていません。〜sed、awk、cutなどの平均的なスクリプト機能があります。 誰かがそれを行う方法を知っていますか?

1
データを最初の列の降順で並べ替え、値が等しい場合は、2番目の列を昇順で使用します
明確にする: 使用頻度のあるキーワードがあると仮定します。 12 Hi 7 Hash 7 C++ 9 Superuser 17 Stackoverflow 9 LaTeX 42 Life 9 Ubuntu 必要なのは、頻度に基づいてこのデータを降順で並べ替えることです。同じ値がある場合は、2番目の列を昇順で使用する必要があります。 sort -n -r foo.txt 最初の部分はありますが、2番目の列もreversed次のとおりです。 42 Life 17 Stackoverflow 12 Hi 9 Ubuntu 9 Superuser 9 LaTeX 7 Hash 7 C++ 次の結果を得るにはどうすればよいですか? 42 Life 17 Stackoverflow 12 Hi 9 LaTeX 9 …

3
coreutilsのソートがPythonより遅いのはなぜですか?
Pythonのソート機能の速度をテストするために、次のスクリプトを作成しました。 from sys import stdin, stdout lines = list(stdin) lines.sort() stdout.writelines(lines) 次に、これsortを1,000万行を含むファイルのcoreutils コマンドと比較しました。 $ time python sort.py <numbers.txt >s1.txt real 0m16.707s user 0m16.288s sys 0m0.420s $ time sort <numbers.txt >s2.txt real 0m45.141s user 2m28.304s sys 0m0.380s 組み込みコマンドは4つのCPUをすべて使用しましたが(Pythonは1つしか使用しませんでした)、実行に約3倍の時間がかかりました!何が得られますか? Ubuntu 12.04.5(32ビット)、Python 2.7.3、およびsort8.13を使用しています

4
lsで最初にアンダースコア文字をソートするにはどうすればよいですか?
同じレベルの他のファイルやディレクトリとは別にしたい場合は、アンダースコアのプレフィックスを付けてファイルやディレクトリに名前を付けることができるのが好きです。たとえば、WindowsおよびMacの場合、ファイルの先頭にアンダースコアを付けると、英数字で始まるファイルの前に、ファイルが先頭にソートされます。 私のグーグルは、LC_COLLATEと私の現在のロケール(en_US)に関係していることが判明しました。それは問題ありませんが、en_USが期待どおりにソートされない理由は本当にわかりません。 ICU Collat​​eデモサイトに基づいて、ロケールをen_US_POSIXに設定すると、確かに私が探している並べ替え順序を持っているように見えます(テストするには、サンプルデータを編集し、アンダースコアを追加する必要があります)。しかし、Linuxシェルでこれをどのように適用するかはあまりわかりません。 理想的には、lsが常にアンダースコアを最初にソートするように、bash構成で何かを設定できるようにしたいと思います。これをどうやってやるの?
20 ls  sort  locale 

2
ソートがソート順を知らない場合のGNUソート安定ソート
2列のファイルがあります。ファイルは既に列1で希望どおりにソートされています。各列1カテゴリ内の列2で並べ替えたいと思います。ただし、sort列1のソート順を理解していません。 通常の方法(スタック上の同様の質問から)はこれです: sort --stable -k1,1 -k2,2n しかし、k1は任意なのでソートを指定できません。 入力例: C 2 C 1 A 2 A 1 B 2 B 1 および出力: C 1 C 2 A 1 A 2 B 1 B 2
18 sort 

1
ディレクトリリストが完全にソートされていない
Debian Linuxシステムに次のディレクトリリストがあります。ただし、奇妙なことの1つは、populate.sqlファイルが他のファイルと共にソートされていないように見えることです。 -rw-r--r-- 1 user1 user1 10004 Jul 28 13:16 populate2.sql -rw-r--r-- 1 user1 user1 10244 Jul 28 13:16 populate3.sql -rw-r--r-- 1 user1 user1 10359 Jul 28 13:16 populate4.sql -rw-r--r-- 1 user1 user1 11618 Jul 28 13:16 populate5.sql -rw-r--r-- 1 user1 user1 11654 Jul 28 13:17 populate6.sql -rw-r--r-- 1 user1 …

5
major.minor.patchレベル、時にはrcでリストをソートするにはどうすればよいですか?
次のリストをシェルスクリプトでソートし、最新バージョンを下部または上部に表示する必要があります。シェルツールのみでそれを行うにはどうすればよいですか? release-5.0.0.rc1 release-5.0.0.rc2 release-5.0.0 release-5.0.1 release-5.0.10 release-5.0.11 release-5.0.13 release-5.0.14 release-5.0.15 release-5.0.16 release-5.0.17 release-5.0.18 release-5.0.19 release-5.0.2 release-5.0.20 release-5.0.21 release-5.0.22 release-5.0.23 release-5.0.24 release-5.0.25 release-5.0.26 release-5.0.27 release-5.0.28 release-5.0.29 release-5.0.3
18 shell-script  awk  sed  python  sort 


3
psコマンドのCPUフィールドをどのようにソートできますか?
CPUを最も多く使用するプロセスを見つける小さなコマンドを作成しようとしています。 最初に、ps aux > file.txt次にを使用しcut -c 16-20 file.txt | sort -n | tail -5ます。 私が得る結果はこれです: 1.0 2.7 8. 14.5 14.5 だから私の質問は、どのように%CPU使用法と他のフィールドの両方を一緒に出力させることができますか?
18 bash  shell-script  sort  ps 

3
Linuxソートのデフォルトの順序は何ですか?
長い間、sortプログラムのデフォルトの動作はASCII順序を使用していると考えていました。ただし、sort引数なしで次の行を入力すると: # @ 私が得た: @ # しかし、ASCIIテーブルによると、#35と@64です。別の例は次のとおりです。 A a 出力は次のとおりです。 a A 誰もこれを説明できますか?ところで、使用する場合の「辞書順」とは何sort -dですか?
18 linux  sort  locale 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.