ディレクトリからパンダにいくつかのcsvファイルを読み取り、それらを1つの大きなDataFrameに連結したいと思います。私はそれを理解することができませんでした。ここに私がこれまでに持っているものがあります:
import glob
import pandas as pd
# get data file names
path =r'C:\DRO\DCL_rawdata_files'
filenames = glob.glob(path + "/*.csv")
dfs = []
for filename in filenames:
dfs.append(pd.read_csv(filename))
# Concatenate all data into one DataFrame
big_frame = pd.concat(dfs, ignore_index=True)
forループ内で助けが必要だと思いますか???
big_frame = pd.concat(dfs, ignore_index=True)
。そうではありませんか?データフレームのリストを取得したら、リストを反復処理して連結する必要がありますbig_frame
dfs
今ループする必要があるので、のようなものが機能するfor df in dfs: big_frame.concat(df, ignore_index=True)
はずですが、append
代わりに試すこともできますconcat
。
concat
データフレームのリストをあなたがしたようにうまく扱えるはずだからです。これは非常に良いアプローチだと思います。
dfs
リストに追加しないので、コードは何もしません。行data = pd.read_csv(filename)
をに置き換えたくないですか?dfs.append(pd.read_csv(filename)
あなたは、リスト上でループする必要があるだろうとconcat
、私は考えていないconcat
のリストに取り組むdf
秒。