タグ付けされた質問 「text-processing」

プログラム、スクリプトなどによるテキストの操作または検査

5
データファイルから特定の行数をランダムに描画します
私は次のようなデータリストを持っています 12345 23456 67891 -20000 200 600 20 ... このデータセット(ファイルの行)のサイズはであると仮定しますN。mこのデータファイルからランダムに線を引きたいです。したがって、出力は2つのファイルになります。1つはこれらmのデータ行を含むファイルで、もう1つはN-mデータ行を含みます。 Linuxコマンドを使用してそれを行う方法はありますか?

4
AWKで正規表現を使用して文字列を置換する方法は?
ファイルからテキストがあると仮定します。 (bookmarks ("Chapter 1 Introduction 1" "#1" ("1.1 Problem Statement and Basic Definitions 23" "#2") ("Exercises 31" "#30") ("Notes and References 42" "#34")) ) 私は各行に11を追加し、その後"に各行にa があれば、 (bookmarks ("Chapter 1 Introduction 12" "#12" ("1.1 Problem Statement and Basic Definitions 34" "#13") ("Exercises 42" "#41") ("Notes and References 53" "#45")) ) GNU …


3
2つのパターンの間の(および除外する)行を印刷する
cURLを使用してフォームを送信します。ここで、一部のコンテンツは他のファイルから取得され、 sed param1を使用して他のファイルからのパターンに一致する行の場合sed、以下のコマンドは正常に動作します: curl -d param1="$(sed -n '/matchpattern/p' file.txt)" -d param2=value2 http://example.com/submit 今、問題に行きます。一致するパターン自体を除く、2つの一致するパターン間のテキストのみを表示したい。 file.txt含まれているとしましょう: Bla bla bla firstmatch It is a long established fact that a reader will be distracted by the readable content of a page when looking at its layout. secondmatch The point of using Lorem Ipsum is …

2
列で出力を並べ替える
このコマンドを使用したいfind -maxdepth 1 -type d | while read -r dir; do printf "%s:\t" "$dir"; find "$dir" | wc -l; done(ここから)。出力は基本的に ./kennel: 11062 ./shadow: 15449 ./ccc: 9765 ./journeyo: 14200 ./norths: 10710 そして、最大から最小の数字でソートします。しかし、私は作り方sort、または別の列で動作するものがわかりません。

5
行として複数行のテキストファイルを並べ替える
この形式のテキストファイルがあります。 #################################### KEY2 VAL21 VAL22 VAL23 VAL24 #################################### KEY1 VAL11 VAL12 VAL13 VAL14 #################################### KEY3 VAL31 VAL32 VAL33 VAL34 このファイルをKEY行ごとに並べ替えて、結果に次の4行を含めたいので、並べ替えられた結果は次のようになります。 #################################### KEY1 VAL11 VAL12 VAL13 VAL14 #################################### KEY2 VAL21 VAL22 VAL23 VAL24 #################################### KEY3 VAL31 VAL32 VAL33 VAL34 これを行う方法はありますか?

5
JSONファイルからデータを抽出する方法
私は私の質問の解決策を探しているビンを持っていますが、見つけたものでそれを手に入れなかった、またはより良いとは言いませんでした。私の問題が何であるかについて話しましょう。Raspberry Piでスマートホームコントロールソフトウェアを使用していますが、今週末、pilight-receiveを使用して、屋外の温度センサーからデータを取得できました。pilight-receiveの出力は次のようになります。 { "message": { "id": 4095, "temperature": 409.5 }, "origin": "receiver", "protocol": "alecto_wsd17", "uuid": "0000-b8-27-eb-0f3db7", "repeats": 3 } { "message": { "id": 1490, "temperature": 25.1, "humidity": 40.0, "battery": 1 }, "origin": "receiver", "protocol": "alecto_ws1700", "uuid": "0000-b8-27-eb-0f3db7", "repeats": 3 } { "message": { "id": 2039, "temperature": 409.5 }, "origin": "receiver", …

2
Grep:全行の検索と置換
コマンド grep "foo" myfile.txt ファイル内の一致するすべての行を出力します。 次に、行全体を別の文字列に置き換えます。どうやってやるの?

7
`.bib`ファイルのBibTexエントリを(どのキーでも)ソートする方法は?
私はLaTeXで作業し、Gitでバージョン管理を行っています。書誌管理にはメンデリーを使用します。 問題は、Mendeleyが.bibエクスポートを同期するたびに、それらの順序が異なるため、書誌のバージョン管理がはるかに難しくなることです。 私のアイデアは、.bibコミットする前に毎回、ファイル内のBibTexエントリをソートすることです。 私を助けてくれませんか、これをスマート(ショート&スイート)な方法で行う方法はありますか?:) PSこのルーチンを手動で実行できます。git統合は必要ありません。プログラム/スクリプトで.bibファイルをソートしたいだけです。

4
CSVファイルから重複したエントリを削除する
重複したデータが再印刷された[csv]ファイルがあります。つまり、同じデータが2回印刷されます。私が使って試したソートのuniqのを でsort myfile.csv | uniq -uしかしに変化がないmyfile.csv、また、私が試していないてきたsudo sort myfile.csv | uniq -uが、何の違いは。 だから現在私のcsvファイルは次のようになります a a a b b c c c c c そのようになりたい a b c

2
欠損値の空白スペースをゼロに置き換える
約30K行のinput.txtタブ区切りテキストファイルがあります。各行(s1..s30K行)で欠損値(つまり、空白)をチェックし、欠損値にゼロ値を入力します。out.txtを参照してください。 input.txt id no1 no2 no3 no4 s1 23 34 45 12 s2 4 4 s3 4 8 0 out.txt id no1 no2 no3 no4 s1 23 34 45 12 s2 0 4 4 0 s3 4 0 8 0


3
awk-特定の列の1文字だけを置き換える
次のようなファイルがあります。 2018.01.02;1.5;comment 1 2018.01.04;2.75;comment 2 2018.01.07;5.25;comment 4 2018.01.09;1.25;comment 7 .2番目の列のすべてのドットをコンマで置き換えたいのです,が、これをsed 's/\./\,/g' fileどのように使用できるsedか、できれawkば2番目の列にのみ適用するので、出力は次のようになります。 2018.01.02;1,5;comment 1 2018.01.04;2,75;comment 2 2018.01.07;5,25;comment 4 2018.01.09;1,25;comment 7

3
ワークフロー(ファイル)から非ASCII文字をすべて削除する
1つのファイルからすべての非ASCII文字を削除するにはどうすればよいですか?これを実行する特定のコマンドはありますか? grep --colour='auto' -P -n'[^\x00-\x7]' /usr/local/... これでワークフロー内のキャラクターが見つかると思いますが、問題のキャラクターのインスタンスをすべて削除するにはどうすればよいですか?


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.