実験からのデータ(60人の回答者)を含む非常に大きなデータフレーム(約100万行)があります。
データフレームを60個のデータフレーム(各参加者のデータフレーム)に分割したいと思います。
データフレームdata
には、'name'
各参加者に固有のコードである、という変数があります。
以下を試しましたが、何も起こりません(または実行が1時間以内に停止しません)。私がやろうとしているのは、data
をより小さなデータフレームに分割し、それらをリストに追加することです(datalist
):
import pandas as pd
def splitframe(data, name='name'):
n = data[name][0]
df = pd.DataFrame(columns=data.columns)
datalist = []
for i in range(len(data)):
if data[name][i] == n:
df = df.append(data.iloc[i])
else:
datalist.append(df)
df = pd.DataFrame(columns=data.columns)
n = data[name][i]
df = df.append(data.iloc[i])
return datalist
エラーメッセージが表示されません。スクリプトは永久に実行されているようです。
それを行うための賢い方法はありますか?