4
パンダデータフレーム内の類似値の割合を計算する
1つのデータフレームがdfあり、2つの列があります。スクリプト(テキスト付き)とスピーカー Script Speaker aze Speaker 1 art Speaker 2 ghb Speaker 3 jka Speaker 1 tyc Speaker 1 avv Speaker 2 bhj Speaker 1 そして、私は以下のリストを持っています: L = ['a','b','c'] 次のコードで、 df = (df.set_index('Speaker')['Script'].str.findall('|'.join(L)) .str.join('|') .str.get_dummies() .sum(level=0)) print (df) 私はこのデータフレームを取得しますdf2: Speaker a b c Speaker 1 2 1 1 Speaker 2 2 …