いくつかのエントリを持つパンダデータフレームがあり、あるタイプの店舗の収入間の相関関係を計算したいと思います。収入データ、活動エリアの分類(劇場、衣料品店、食品など)およびその他のデータを備えた店舗が多数あります。
新しいデータフレームを作成し、同じカテゴリに属するすべての種類の店舗の収入を含む列を挿入しようとしましたが、返されるデータフレームには最初の列のみが入力され、残りはNaNでいっぱいです。私が疲れたコード:
corr = pd.DataFrame()
for at in activity:
stores.loc[stores['Activity']==at]['income']
そうしたいので、.corr()
店舗のカテゴリ間の相関行列を与えるために使用できます。
その後、matplolibでマトリックス値(ピアソンの相関を使用するため、-1から1)をプロットする方法を知りたいと思います。
stanford.edu/~mwaskom/software/seaborn/examples/…–
—
エムレ