回答:
オールドスクール—あなたが使うことができますdd
:
dd if=A_FILE bs=1 skip=3
入力ファイルはA_FILE
で、ブロックサイズは1文字(バイト)で、最初の3つの「ブロック」(バイト)をスキップします。(dd
GNUなどの一部のバリアントではdd
、bs=1c
ここで使用できますbs=1k
。他の状況では、1キロバイトのブロックで読み取るような代替手段がありますdd
。AIXではがこれをサポートしていないようです。BSD(macOS Sierra)バリアントはサポートしていませんc
しかしんサポートk
、m
、g
、など)
同じ結果を得る他の方法もあります:
sed '1s/^...//' A_FILE
これは、最初の行に3文字以上ある場合に機能します。
tail -c +4 A_FILE
また、Perl、Pythonなども使用できます。
使用cat
する代わりに、次のように使用できますtail
。
tail -c +4 FILE
これにより、最初の3バイトを除くファイル全体が出力されます。詳細man tail
については、相談してください。
/usr/xpg4/bin/tail
では、少なくとも私のマシンではを使用する必要があります。それでも良いヒント!
私は最近同様のことをする必要がありました。私はフィールドサポートの問題を支援しており、技術者が変更を加えているときにリアルタイムのプロットを確認する必要がありました。データは1日を通して増加するバイナリログにあります。ログのデータを解析してプロットできるソフトウェアがありますが、現在はリアルタイムではありません。データの処理を開始する前にログのサイズを取得し、データを処理するループに入り、各パスで、まだ処理されていないファイルのバイトで新しいファイルを作成しました。
#!/usr/bin/env bash
# I named this little script hackjob.sh
# The purpose of this is to process an input file and load the results into
# a database. The file is constantly being update, so this runs in a loop
# and every pass it creates a new temp file with bytes that have not yet been
# processed. It runs about 15 seconds behind real time so it's
# pseudo real time. This will eventually be replaced by a real time
# queue based version, but this does work and surprisingly well actually.
set -x
# Current data in YYYYMMDD fomat
DATE=`date +%Y%m%d`
INPUT_PATH=/path/to/my/data
IFILE1=${INPUT_PATH}/${DATE}_my_input_file.dat
OUTPUT_PATH=/tmp
OFILE1=${OUTPUT_PATH}/${DATE}_my_input_file.dat
# Capture the size of the original file
SIZE1=`ls -l ${IFILE1} | awk '{print $5}'`
# Copy the original file to /tmp
cp ${IFILE1} ${OFILE1}
while :
do
sleep 5
# process_my_data.py ${OFILE1}
rm ${OFILE1}
# Copy IFILE1 to OFILE1 minus skipping the amount of data already processed
dd skip=${SIZE1} bs=1 if=${IFILE1} of=${OFILE1}
# Update the size of the input file
SIZE1=`ls -l ${IFILE1} | awk '{print $5}'`
echo
DATE=`date +%Y%m%d`
done
ls
ます。stat -c'%s' "${IFILE}"
そのls|awk
コンボの代わりに使用することを検討しましたか?つまり、GNU coreutilsを想定しています...
システムにPythonがインストールされている場合、小さなpythonスクリプトを使用seek()
して、次のように関数を利用してn番目のバイトから読み取りを開始できます。
#!/usr/bin/env python3
import sys
with open(sys.argv[1],'rb') as fd:
fd.seek(int(sys.argv[2]))
for line in fd:
print(line.decode().strip())
そして使用法はそのようになります:
$ ./skip_bytes.py input.txt 3
バイトカウントは0から始まる(したがって、最初のバイトは実際にはインデックス0である)ことに注意してください。したがって、3を指定することにより、3 + 1 = 4番目のバイトから始まるように読み取り値を効果的に配置しています。
dd if=A_FILE bs=1 skip=3
、AIX 6.1