私は次のパンダのデータフレームを持っていますTop15
:
1人あたりの引用可能なドキュメントの数を推定する列を作成します。
Top15['PopEst'] = Top15['Energy Supply'] / Top15['Energy Supply per Capita']
Top15['Citable docs per Capita'] = Top15['Citable documents'] / Top15['PopEst']
一人当たりの被引用文献数と一人当たりのエネルギー供給量の相関関係を知りたい。だから私は.corr()
メソッド(ピアソンの相関)を使います:
data = Top15[['Citable docs per Capita','Energy Supply per Capita']]
correlation = data.corr(method='pearson')
単一の数値を返したいのですが、結果は次のとおりです。
.corr
データフレームに直接適用すると、すべてのペアワイズ相関が返されます。そのため、行列の対角線で1を観測します(各列はそれ自体と完全に相関しています)。以下の私の編集を参照してください。