Unix & Linux text-processing

5

私は次のようなデータリストを持っています 12345 23456 67891 -20000 200 600 20 ... このデータセット（ファイルの行）のサイズはであると仮定しますN。mこのデータファイルからランダムに線を引きたいです。したがって、出力は2つのファイルになります。1つはこれらmのデータ行を含むファイルで、もう1つはN-mデータ行を含みます。 Linuxコマンドを使用してそれを行う方法はありますか？

13 linux shell text-processing

4

AWKで正規表現を使用して文字列を置換する方法は？

ファイルからテキストがあると仮定します。 (bookmarks ("Chapter 1 Introduction 1" "#1" ("1.1 Problem Statement and Basic Definitions 23" "#2") ("Exercises 31" "#30") ("Notes and References 42" "#34")) ) 私は各行に11を追加し、その後"に各行にa があれば、 (bookmarks ("Chapter 1 Introduction 12" "#12" ("1.1 Problem Statement and Basic Definitions 34" "#13") ("Exercises 42" "#41") ("Notes and References 53" "#45")) ) GNU …

13 regular-expression awk text-processing

3

一致する行をファイルにリダイレクトし、一致しない行を別のファイルにリダイレクトするにはどうすればよいですか？

最適化された方法で、次の要件に対して既に利用可能なスクリプト/プログラム/ユーティリティはありますか？ someCommand | tee >(grep "pattern" > LinesWhichMatch) | grep -v "pattern" > LinesWhichDoesNotMatch

13 text-processing grep tee

3

2つのパターンの間の（および除外する）行を印刷する

cURLを使用してフォームを送信します。ここで、一部のコンテンツは他のファイルから取得され、 sed param1を使用して他のファイルからのパターンに一致する行の場合sed、以下のコマンドは正常に動作します： curl -d param1="$(sed -n '/matchpattern/p' file.txt)" -d param2=value2 http://example.com/submit 今、問題に行きます。一致するパターン自体を除く、2つの一致するパターン間のテキストのみを表示したい。 file.txt含まれているとしましょう： Bla bla bla firstmatch It is a long established fact that a reader will be distracted by the readable content of a page when looking at its layout. secondmatch The point of using Lorem Ipsum is …

13 text-processing sed

2

列で出力を並べ替える

このコマンドを使用したいfind -maxdepth 1 -type d | while read -r dir; do printf "%s:\t" "$dir"; find "$dir" | wc -l; done（ここから）。出力は基本的に ./kennel: 11062 ./shadow: 15449 ./ccc: 9765 ./journeyo: 14200 ./norths: 10710 そして、最大から最小の数字でソートします。しかし、私は作り方sort、または別の列で動作するものがわかりません。

13 command-line text-processing sort

5

行として複数行のテキストファイルを並べ替える

この形式のテキストファイルがあります。 #################################### KEY2 VAL21 VAL22 VAL23 VAL24 #################################### KEY1 VAL11 VAL12 VAL13 VAL14 #################################### KEY3 VAL31 VAL32 VAL33 VAL34 このファイルをKEY行ごとに並べ替えて、結果に次の4行を含めたいので、並べ替えられた結果は次のようになります。 #################################### KEY1 VAL11 VAL12 VAL13 VAL14 #################################### KEY2 VAL21 VAL22 VAL23 VAL24 #################################### KEY3 VAL31 VAL32 VAL33 VAL34 これを行う方法はありますか？

13 linux text-processing sort

5

JSONファイルからデータを抽出する方法

私は私の質問の解決策を探しているビンを持っていますが、見つけたものでそれを手に入れなかった、またはより良いとは言いませんでした。私の問題が何であるかについて話しましょう。Raspberry Piでスマートホームコントロールソフトウェアを使用していますが、今週末、pilight-receiveを使用して、屋外の温度センサーからデータを取得できました。pilight-receiveの出力は次のようになります。 { "message": { "id": 4095, "temperature": 409.5 }, "origin": "receiver", "protocol": "alecto_wsd17", "uuid": "0000-b8-27-eb-0f3db7", "repeats": 3 } { "message": { "id": 1490, "temperature": 25.1, "humidity": 40.0, "battery": 1 }, "origin": "receiver", "protocol": "alecto_ws1700", "uuid": "0000-b8-27-eb-0f3db7", "repeats": 3 } { "message": { "id": 2039, "temperature": 409.5 }, "origin": "receiver", …

13 text-processing json

2

Grep：全行の検索と置換

コマンド grep "foo" myfile.txt ファイル内の一致するすべての行を出力します。次に、行全体を別の文字列に置き換えます。どうやってやるの？

13 text-processing grep

7

`.bib`ファイルのBibTexエントリを（どのキーでも）ソートする方法は？

私はLaTeXで作業し、Gitでバージョン管理を行っています。書誌管理にはメンデリーを使用します。問題は、Mendeleyが.bibエクスポートを同期するたびに、それらの順序が異なるため、書誌のバージョン管理がはるかに難しくなることです。私のアイデアは、.bibコミットする前に毎回、ファイル内のBibTexエントリをソートすることです。私を助けてくれませんか、これをスマート（ショート＆スイート）な方法で行う方法はありますか？:) PSこのルーチンを手動で実行できます。git統合は必要ありません。プログラム/スクリプトで.bibファイルをソートしたいだけです。

13 text-processing git sort latex

4

CSVファイルから重複したエントリを削除する

重複したデータが再印刷された[csv]ファイルがあります。つまり、同じデータが2回印刷されます。私が使って試したソートのuniqのをでsort myfile.csv | uniq -uしかしに変化がないmyfile.csv、また、私が試していないてきたsudo sort myfile.csv | uniq -uが、何の違いは。だから現在私のcsvファイルは次のようになります a a a b b c c c c c そのようになりたい a b c

13 text-processing files

2

欠損値の空白スペースをゼロに置き換える

約30K行のinput.txtタブ区切りテキストファイルがあります。各行（s1..s30K行）で欠損値（つまり、空白）をチェックし、欠損値にゼロ値を入力します。out.txtを参照してください。 input.txt id no1 no2 no3 no4 s1 23 34 45 12 s2 4 4 s3 4 8 0 out.txt id no1 no2 no3 no4 s1 23 34 45 12 s2 0 4 4 0 s3 4 0 8 0

13 text-processing sed awk perl

5

テキストファイルからセグメントを取り出す最善の方法は何ですか？

巨大なテキストファイルから20行目から45行目を抽出するための良い方法は何でしょうか。もちろん非インタラクティブに！

13 command-line text-processing

3

awk-特定の列の1文字だけを置き換える

次のようなファイルがあります。 2018.01.02;1.5;comment 1 2018.01.04;2.75;comment 2 2018.01.07;5.25;comment 4 2018.01.09;1.25;comment 7 .2番目の列のすべてのドットをコンマで置き換えたいのです,が、これをsed 's/\./\,/g' fileどのように使用できるsedか、できれawkば2番目の列にのみ適用するので、出力は次のようになります。 2018.01.02;1,5;comment 1 2018.01.04;2,75;comment 2 2018.01.07;5,25;comment 4 2018.01.09;1,25;comment 7

13 text-processing awk sed

3

ワークフロー（ファイル）から非ASCII文字をすべて削除する

1つのファイルからすべての非ASCII文字を削除するにはどうすればよいですか？これを実行する特定のコマンドはありますか？ grep --colour='auto' -P -n'[^\x00-\x7]' /usr/local/... これでワークフロー内のキャラクターが見つかると思いますが、問題のキャラクターのインスタンスをすべて削除するにはどうすればよいですか？

12 text-processing ascii

9

2進数に従って単語のリストを作成する

私は次のようなマトリックスを持っています：入力： A B C D E F G H I 0 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 1 …

12 text-processing awk

タグ付けされた質問 「text-processing」

タグ付けされた質問「text-processing」