大きなCSVファイルをインポートし、ファイル内の各単語の出現回数をカウントして、そのカウントを別のCSVファイルにエクスポートするPythonスクリプトがあります。
しかし、何が起こっているのかというと、そのカウント部分が終了してエクスポートが開始されるとKilled
、ターミナルに表示されます。
これはメモリの問題ではないと思います(もしそうなら、メモリエラーが発生するのではなく、発生すると思いますKilled
)。
プロセスに時間がかかりすぎている可能性がありますか?もしそうなら、私がこれを避けることができるようにタイムアウト期間を延長する方法はありますか?
コードは次のとおりです。
csv.field_size_limit(sys.maxsize)
counter={}
with open("/home/alex/Documents/version2/cooccur_list.csv",'rb') as file_name:
reader=csv.reader(file_name)
for row in reader:
if len(row)>1:
pair=row[0]+' '+row[1]
if pair in counter:
counter[pair]+=1
else:
counter[pair]=1
print 'finished counting'
writer = csv.writer(open('/home/alex/Documents/version2/dict.csv', 'wb'))
for key, value in counter.items():
writer.writerow([key, value])
そして、印刷Killed
後に発生finished counting
し、完全なメッセージは次のとおりです。
killed (program exited with code: 137)