データのログ変換を正しく行っていますか?


8

一部のデータに対して探索的データ分析を行っており、次のヒストグラムが得られます。

ここに画像の説明を入力してください

これはデータのログ変換の候補のように見えるため、次のPythonコードを実行してデータを変換します。

df["abv"].apply(np.log).hist()
df["ibu"].apply(np.log).hist()
plt.show()

そして、変換されたヒストグラムのこの新しいプロットを取得します。

ここに画像の説明を入力してください

この場合、ログ変換で問題がなかったと思いますか。その場合、結果を解釈するための最良の方法は何ですか。


6
hist(logx=True)代わりに電話してみてください。
Emre

回答:


5

はい、対数変換はより良い解釈のための良い解決策のようです。これら2つのデータセット間のオーバーラップは非常に小さいため、プロットを見るだけで、それらは互いに大幅に異なることが確実に言えます。


1
これと@Emreの話の間に、私は正しい軌道に乗った!
Jon
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.