私はこのようなデータフレームを持っています:
x = pd.DataFrame({
'audio': ['audio1', 'audio1', 'audio2', 'audio2', 'audio3', 'audio3'],
'text': ['text1', 'text2', 'text3', 'text4', 'text5', 'text6'],
'login': ['operator1', 'operator2', 'operator3', 'operator4', 'operator5', 'operator6']
})
私はそれを次のように集計しようとしています:
x1 = x.groupby('audio')['text'].agg(
[
('text1', lambda x : x.iat[0]),
('text2', lambda x : x.iat[1]),
('leven', lambda x: Levenshtein.distance(x.iat[0], x.iat[1])) #some function works with grouped text
]
).reset_index()
それは機能しますが、グループ化されたログインを行に追加して、次のような行にする必要もあります。
audio, text1, text2, leven, login1, login2
私は何かを試しましたlambda x : x.ait[0, 1]
が、うまくいきません
データは常に順序付けされており、一緒に属する2つの行のペアになっていますか?
—
Darkonaut