タグ付けされた質問 「text-processing」

プログラム、スクリプトなどによるテキストの操作または検査

6
タブ区切りデータをコンマ区切りデータに変換するにはどうすればよいですか?
アマゾンのec2コマンドラインツールを介してec2スナップショットのリストをリクエストしています。 ec2-describe-snapshots -H --hide-tags > snapshots.csv データは次のようになります。 SnapshotId VolumeId StartTime OwnerId VolumeSize Description snap-00b66464 vol-b99a38d0 2012-01-05 5098939 160 my backup リダイレクトする前にデータを傍受snapshots.csvし、次のことを行うにはどうすればよいですか。 「タブ」をコンマに置き換えます 引用符で値をカプセル化する 値がすべて数値の場合は、プレフィックスとしてを付けて、=Excelでテキストとして扱われるようにします。たとえばOwnerId、"=5098939"にする必要があります(これはインラインで実行できず、代わりにスクリプトファイルまたは関数が必要な場合は必要ありません)。 望ましい出力: "SnapshotId","VolumeId","StartTime","OwnerId","VolumeSize","Description" "snap-00b66464","vol-b99a38d0","2012-01-05","=5098939","=160","my backup"

3
1つの表現を使用して複数の針を1つの単語で検索および置換する方法
テキストファイルがあるとします。 foo fnord bar bizz foo poit そして今、「foo」と「bar」の両方を「narf」に置き換えたいと思います。 私は使用できることを知っています: sed -e 's/foo/narf/g' -e 's/bar/narf/g' fileName それでも、1つの式で両方の針に一致するように正規表現に指示するOR演算子を使用したいと思います。 いくつかのマニュアルを読んで、パイプは自分のニーズに合うはずだと思いますが、試しました sed -e 's/foo|bar/narf/g' -i fileName そしてそれは機能せず、エラーをスローすることすらありません。 ここで何が悪いのですか?

1
日付を「2011年7月29日」から「20110729」に変更
フォーマット付きの日付を含むHTMLファイルがたくさんあります July 29th, 2011 私は、日付の書式を変更するJuly 29th, 2011には20110729、December 9th, 2010する20101209など、 私sedはうまくいくかもしれませんが、その間接的なシーケンスのために解決策を見つけることができません。

5
POSIX.2の最後のマーカーからEOFへのテキストの取得
次のようなマーカー行のあるテキストがあります。 aaa --- bbb --- ccc 最後のマーカー(包括的ではない)からEOFまでのテキストを取得する必要があります。この場合、それは ccc POSIX.2内にエレガントな方法はありますか?最初:今、私は二つの実験に使用nlし、grepそれぞれの行番号の最後に出現するために。次に、行番号sedを抽出し、問題のチャンクを抽出するために使用します。 テキストセグメントは非常に大きくなる可能性があるため、テキストをバッファーに追加するようなテキスト追加メソッドを使用することを恐れています。マーカーに遭遇した場合、バッファーを空にし、EOFで最後のチャンクをバッファ。

5
UNIXユーティリティはどの程度インテリジェントですか?
sort、find、grep、diffなどのUnixユーティリティは、コードをまったく記述しなくても、すばやくタスクを実行するのに非常に便利です。 彼らが内部で使用しているアルゴリズムと、特定のタスクの特定のアルゴリズムをインテリジェントに決定する方法を知りたいのですが?たとえば、sortが巨大な入力ファイルを取得する場合、データサイズごとに異なるアルゴリズムを使用しますか? grepは、さまざまなデータセットを検索しながらアルゴリズムをインテリジェントに切り替えますか?


4
テキストハンドラーを使用してNessusレポートからIPアドレスとファイルパスを抽出する必要があります
Grep / Awk / Sed / Trなどのテキストハンドラーを使用して、NessusレポートからIPアドレスとファイルパスを抽出する必要があります。 IPアドレスとファイルパスを分離するスクリプトがありますが、テキストをさらに処理し、「パッチが適用されていないリモートバージョン...」を削除する必要があります。 192.168.1.1 - C:\WINDOWS\SYSTEM32\GPPREF.DLL HAS NOT BEEN PATCHED. REMOTE VERSION : 6.2.9200.16384 SHOULD BE : 6.2.9200.16859" 192.168.1.2 THE REMOTE HOST IS MISSING ONE OF THE FOLLOWING ROLLUP KBS : - 4022719 - 4022722C:\WINDOWS\SYSTEM32\BCRYPT.DLL HAS NOT BEEN PATCHED. REMOTE VERSION : 6.1.7601.23796 SHOULD BE …
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.