回答:
をstyle
呼び出すときに、プロットされたラインのを指定できますdf.plot
。
df.plot(x='col_name_1', y='col_name_2', style='o')
style
引数もすることができdict
たりlist
、例えば:
import numpy as np
import pandas as pd
d = {'one' : np.random.rand(10),
'two' : np.random.rand(10)}
df = pd.DataFrame(d)
df.plot(style=['o','rx'])
使用可能なすべてのスタイル形式は、のドキュメントにリストされていますmatplotlib.pyplot.plot
。
これ(およびほとんどのプロット)では、matplotlibへのPandasラッパーに依存しません。代わりに、直接matplotlibを使用します。
import matplotlib.pyplot as plt
plt.scatter(df['col_name_1'], df['col_name_2'])
plt.show() # Depending on whether you use IPython or interactive mode, etc.
df.col_name_1.values
たとえば、列の値のNumPy配列にアクセスできることを覚えておいてください。
ミリ秒の精度のTimestamp値の列の場合、これをPandasのデフォルトのプロットで使用すると問題が発生しました。オブジェクトをdatetime64
タイプに変換しようとしたときに、厄介な問題も発見しました。
Pandas
matplotlib
基本的なプロットのライブラリとして使用します。あなたのケースで最も簡単な方法は以下を使用します:
import pandas as pd
import numpy as np
#creating sample data
sample_data={'col_name_1':np.random.rand(20),
'col_name_2': np.random.rand(20)}
df= pd.DataFrame(sample_data)
df.plot(x='col_name_1', y='col_name_2', style='o')
ただし、seaborn
基本的なレベルに移行せずにさらにカスタマイズしたプロットが必要な場合は、代替ソリューションとして使用することをお勧めしますmatplotlib.
。この場合、ソリューションは次のようになります。
import pandas as pd
import seaborn as sns
import numpy as np
#creating sample data
sample_data={'col_name_1':np.random.rand(20),
'col_name_2': np.random.rand(20)}
df= pd.DataFrame(sample_data)
sns.scatterplot(x="col_name_1", y="col_name_2", data=df)
最新のパンダでは、df.plot.scatter関数を直接使用できます
df = pd.DataFrame([[5.1, 3.5, 0], [4.9, 3.0, 0], [7.0, 3.2, 1],
[6.4, 3.2, 1], [5.9, 3.0, 2]],
columns=['length', 'width', 'species'])
ax1 = df.plot.scatter(x='length',
y='width',
c='DarkBlue')
https://pandas.pydata.org/pandas-docs/version/0.23/generated/pandas.DataFrame.plot.scatter.html