Pythonでcsvファイルにヘッダーを追加します


85

2つのcsvファイルをマージするPythonスクリプトを作成しました。次に、最終的なcsvにヘッダーを追加します。ここで報告されている提案に従ってみましたが、次のエラーが発生しましたexpected string, float found。これを修正するための最もPython的な方法は何ですか?

これが私が使用しているコードです:

import csv

with open('combined_file.csv', 'w', newline='') as outcsv:
    writer = csv.DictWriter(outcsv, fieldnames = ["Date", "temperature 1", "Temperature 2"])
    writer.writeheader()

    with open('t1.csv', 'r', newline='') as incsv:
        reader = csv.reader(incsv)
        writer.writerows(row + [0.0] for row in reader)

    with open('t2.csv', 'r', newline='') as incsv:
        reader = csv.reader(incsv)
        writer.writerows(row[:1] + [0.0] + row[1:] for row in reader)

csvファイルにいくつの列を書き込んでいますか?質問で指定してください1.ファイルの入力形式2.出力形式
nio

@nio:投稿されたコードの大部分は、OPによるこの前の質問
MartijnPieters

回答:


116

DictWriter()クラスが期待辞書行ごとに。最初のヘッダーを作成するだけの場合は、通常のヘッダーを使用しcsv.writer()て、ヘッダーに単純な行を渡します。

import csv

with open('combined_file.csv', 'w', newline='') as outcsv:
    writer = csv.writer(outcsv)
    writer.writerow(["Date", "temperature 1", "Temperature 2"])

    with open('t1.csv', 'r', newline='') as incsv:
        reader = csv.reader(incsv)
        writer.writerows(row + [0.0] for row in reader)

    with open('t2.csv', 'r', newline='') as incsv:
        reader = csv.reader(incsv)
        writer.writerows(row[:1] + [0.0] + row[1:] for row in reader)

別の方法は、データをコピーするときに辞書を生成することです。

import csv

with open('combined_file.csv', 'w', newline='') as outcsv:
    writer = csv.DictWriter(outcsv, fieldnames = ["Date", "temperature 1", "Temperature 2"])
    writer.writeheader()

    with open('t1.csv', 'r', newline='') as incsv:
        reader = csv.reader(incsv)
        writer.writerows({'Date': row[0], 'temperature 1': row[1], 'temperature 2': 0.0} for row in reader)

    with open('t2.csv', 'r', newline='') as incsv:
        reader = csv.reader(incsv)
        writer.writerows({'Date': row[0], 'temperature 1': 0.0, 'temperature 2': row[1]} for row in reader)

1
ファイルがバイナリモードで開かれているのはなぜですか?csvファイルは明らかにテキストであり、バイナリ形式ではありません。これにより、Windowsシステムで問題が発生する可能性があります。
pcarter 2017

3
@pcarter:Python 2では、Windowsでテキストモードでファイルを開くと、CSV形式と互換性のない改行変換がトリガーされます。csvしたがって、モジュールは改行を直接(必要に応じて使用\n\r\nて)処理する必要があります。つまり、ファイルをバイナリモードで開く必要があります。参照csv.reader()ドキュメントをcsvfile内のファイルオブジェクトである場合、それはそれが違いをプラットフォームにフラグ「b」で開かれている必要があります。。Python 3では、代わりにこのnewline=''オプションを使用します
MartijnPieters

これはおかしなことに機能します。ファイルをaモードで開くwriter.writeheader()と、ヘッダー行が既に書き込まれているにもかかわらず、ヘッダーが2回書き込まれます。
loretoparisi

2
@loretoparisi:もちろんそうです。writer.writeheader()既存のファイルに追加する場合は使用しないでください。csv.writer()オブジェクトは、既存のファイルにデータを書き込んでいることを検出することはできません。
MartijnPieters

Python 3では、「w」オプションを指定してファイルを開く必要があり、バイナリは機能しません。答えの中でこれに言及することは有用でしょう。:私はここで、この違い見つかっstackoverflow.com/questions/34283178/...
クリストフ

7

ループを実行する前に、行を1つ追加するだけです。この行には、CSVファイルのヘッダー名が含まれています。

schema = ['a','b','c','b']
row = 4
generators = ['A','B','C','D']
with open('test.csv','wb') as csvfile:    
     writer = csv.writer(csvfile, delimiter=delimiter)
# Gives the header name row into csv
     writer.writerow([g for g in schema])   
#Data add in csv file       
     for x in xrange(rows):
         writer.writerow([g() for g in generators])

4

これは私のために働いた。

header = ['row1', 'row2', 'row3']
some_list = [1, 2, 3]
with open('test.csv', 'wt', newline ='') as file:
    writer = csv.writer(file, delimiter=',')
    writer.writerow(i for i in header)
    for j in some_list:
        writer.writerow(j)

1
ファイルを変数として使用することはお勧めできません。3行目。代わりにcsvfileまたはその他のものを使用してください。
ゴルゴンゾーラ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.