タグ付けされた質問 「text-processing」

プログラム、スクリプトなどによるテキストの操作または検査


1
bashでnull区切りの入力で「head」と「tail」を行う方法は?
findコマンドは、ファイル名をヌル区切りの文字列(指定されている場合-print0)として出力xargsし、-0オプションをオンにしてそれらを使用できます。しかし、その間に、そのファイルのコレクションを操作するのは難しいです- sortコマンドには-zスイッチがあり、それによりそれらのファイルを並べ替えることができますがhead、tail持っていません。 どのようにして行うことができますheadし、tail便利な方法でそれらのヌル区切り入力に?(私はいつでも短くて遅いルビースクリプトを作成できますが、もっと良い方法があるといいのですが)

4
長い文字列に改行を挿入するコマンドラインツールはありますか?
限られたテキスト幅で表示する必要のある長い文字列が与えられた場合、各行が特定のテキスト幅以下の単一行の文字列を複数行の文字列に変換する* nixのコマンドラインツールはありますか? たとえば、次の文字列が与えられた場合 $ MYSTRING="Call me Ishmael. Some years ago - never mind how long precisely - having little or no money in my purse, and nothing particular to interest me on shore, I thought I would sail about a little and see the watery part of the world." 私はこのような形式にしたいと思います: …

3
特定のディレクトリ内のすべてのファイルを日付順に連結するにはどうすればよいですか?最新のファイルが一番上にある必要がありますか?
そして、一番古いファイルが一番下にありますか? また、これを行うと、各HTMLファイルに含まれる冗長ヘッダーを削除することもできますか?私は自分自身が多くのHTMLファイルを連結しているのを見ています、そして最終的なファイルのファイルサイズを少し減らすといいでしょう。

7
奇数行を印刷し、偶数行を印刷します
ファイルから奇数行と偶数行を印刷したい。 エコーを利用するこのシェルスクリプトを見つけました。 #!/bin/bash # Write a shell script that, given a file name as the argument will write # the even numbered line to a file with name evenfile and odd numbered lines # in a text file called oddfile. # ------------------------------------------------------------------------- # Copyright (c) 2001 nixCraft project <http://cyberciti.biz/fb/> # …

3
「トップ」で特定のプロセスを選択する方法は?
1つのプログラムに複数のインスタンスがある場合、実行すると次のようになりpidof programます。 `1 2 3` top -pコンマ区切りの引数を受け入れます:1, 2, 3。 これはそれtop -p `pidof program`が機能しないことを意味します: top: unknown argument '1' usage: top -hv | -bcisSH -d delay -n iterations [-u user | -U user] -p pid [,pid ...] これを行う方法を教えてください。私はawkやsedなどに慣れていません...


6
ログファイルの最後のn行のみをどのように保持しますか?
私が書いたスクリプトは何かをし、最後にそれ自身のログファイルにいくつかの行を追加します。ログファイルの最後のn行(たとえば、1000行)だけを保持したいと思います。これは、次の方法でスクリプトの最後に実行できます。 tail -n 1000 myscript.log > myscript.log.tmp mv -f myscript.log.tmp myscript.log しかし、よりクリーンでエレガントなソリューションはありますか?おそらく、単一のコマンドで達成できますか?


9
行と列の転置
以下のような行を持つファイルがあります。 title1:A1 title2:A2 title3:A3 title4:A4 title5:A5 title1:B1 title2:B2 title3:B3 title4:B4 title5:B5 title1:C1 title2:C2 title3:C3 title4:C4 title5:C5 title1:D1 title2:D2 title3:D3 title4:D4 title5:D5 どうすればこれを達成できますか? title1 title2 title3 title4 A1 A2 A3 A4 B1 B2 B3 B4 C1 C2 C3 C4 D1 D2 D3 D4

4
ファイルを2つに分割する
大きなファイルがあり、2つのファイルに分割する必要があります。最初のファイルで1000行を選択して別のファイルに入れ、最初のファイルのそれらの行を削除するとします。 使用してみsplitましたが、複数のチャンクを作成しています。

8
特定の文字がファイルに出現する回数を数える方法は?
たとえば、すべての引用(")文字を数えたいとします。ファイルに必要以上の引用があるかどうか心配します。 例えば: cluster-env,"manage_dirs_on_root","true" cluster-env,"one_dir_per_partition","false" cluster-env,"override_uid","true" cluster-env,"recovery_enabled","false" 推測される結果: 16

10
行番号でファイルをフィルターする
行ごとに1つの非負の整数を持つファイルLとテキストファイルFが与えられた場合、ファイルLに行番号が表示されるFの行のみを保持する高速な方法は何でしょうか。 例: $ cat L.txt 1 3 $ cat F.txt Hello World Hallo Welt Hola mundo $ command-in-question -x L.txt F.txt Hello World Hola mundo 5億以上のエントリを持つファイルLを処理できるコマンドを探しています。ファイルLは数値順にソートされます。 注:私はaの実装の途中ですcommand-in-questionが、ここでもUnixツールを使用できるかどうか疑問に思いました。 更新:すべての答えをありがとう、私は今日多くを学びました!もう1つ答えを受け入れたいのですが、それは不可能です。



弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.