個別のPandas DataFrameをサブプロットとしてプロットするにはどうすればよいですか?


129

同じ値スケールを共有するPandas DataFrameがいくつかありますが、列とインデックスが異なります。を呼び出すとdf.plot()、個別のプロット画像が表示されます。私が本当に望んでいるのは、それらすべてをサブプロットと同じプロットに配置することですが、残念ながら、解決策を考え出せず、いくつかの助けを大いに感謝しています。

回答:


250

matplotlibを使用して手動でサブプロットを作成し、axキーワードを使用して特定のサブプロットにデータフレームをプロットできます。たとえば、4つのサブプロット(2x2)の場合:

import matplotlib.pyplot as plt

fig, axes = plt.subplots(nrows=2, ncols=2)

df1.plot(ax=axes[0,0])
df2.plot(ax=axes[0,1])
...

ここではaxes別のサブプロット軸を保持する配列であり、あなただけのインデックスにより1にアクセスすることができますaxes
あなたが共有し、x軸をしたい場合は、提供することができますsharex=Trueplt.subplots


33
厄介なことに、.subplots()作成しているサブプロットの配列の次元に応じて異なる座標系を返します。したがって、たとえばのサブプロットを返すnrows=2, ncols=1場合は、軸をaxes[0]およびとしてインデックス付けする必要がありますaxes[1]stackoverflow.com/a/21967899/1569221を
canary_in_the_data_mine

3
@canary_in_the_data_mineおかげで、本当に面倒です...あなたのコメントは私に時間を節約しました:)私がなぜ得ているのか理解できませんでしたIndexError: too many indices for array
snd

9
@canary_in_the_data_mineこれは、デフォルトの引数.subplot()が使用されている場合にのみ迷惑です。行と列のいずれの場合でも常にを返すように設定squeeze=Falseします。.subplot()ndarray
Martin、

73

あなたはegを見ることができます。内のドキュメントヨリス答えを実証しました。またドキュメントから、あなたも設定することができますsubplots=Trueし、layout=(,)パンダの内のplot機能:

df.plot(subplots=True, layout=(1,2))

herefig.add_subplot()の投稿説明されているように、221、222、223、224などのサブプロットグリッドパラメーターを取るwhichを使用することもできます。サブプロットを含むパンダデータフレームのプロットの良い例は、このipythonノートブックで見ることができます。


2
jorisの回答は一般的なmatplotlibの使用法には最適ですが、パンダを使用してデータをすばやく視覚化したい人には最適です。それはまた、質問と少し良く一致します。
リトルボビーテーブル

ことを覚えておいてくださいsubplotslayoutkwargsからは、単一のデータフレームのために複数のプロットを生成します。これは関連していますが、複数のデータフレームを単一のプロットにプロットするというOPの問題の解決策ではありません。
オースティンA

1
これは、純粋なパンダ使用のためのより良い答えです。これは、matplotlibを直接インポートする必要がなく(通常、とにかくそうする必要があります)、任意の形状(layout=(df.shape[1], 1)たとえば、を使用できます)のループは必要ありません。
アナトリーマカレビッチ

20

おなじみのMatplotlibスタイルを使用してa figureとを呼び出すことができますが、を使用しsubplotて現在の軸を指定するだけですplt.gca()。例:

plt.figure(1)
plt.subplot(2,2,1)
df.A.plot() #no need to specify for first axis
plt.subplot(2,2,2)
df.B.plot(ax=plt.gca())
plt.subplot(2,2,3)
df.C.plot(ax=plt.gca())

等...


6

すべてのデータフレームのリストを作成するという簡単なトリックで、matplotlibを使用して、複数のパンダデータフレームの複数のサブプロットをプロットできます。次に、forループを使用してサブプロットをプロットします。

作業コード:

import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
# dataframe sample data
df1 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df2 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df3 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df4 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df5 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df6 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
#define number of rows and columns for subplots
nrow=3
ncol=2
# make a list of all dataframes 
df_list = [df1 ,df2, df3, df4, df5, df6]
fig, axes = plt.subplots(nrow, ncol)
# plot counter
count=0
for r in range(nrow):
    for c in range(ncol):
        df_list[count].plot(ax=axes[r,c])
        count=+1

ここに画像の説明を入力してください

このコードを使用すると、任意の構成でサブプロットをプロットできます。あなただけの行数を定義する必要があるnrowと列の数をncol。また、df_listプロットしたいデータフレームのリストを作成する必要があります。


2
それはありません。最後の行にタイプミスに注意を払うcount =+1が、count +=1
PEBKAC

4

あなたはこれを使うことができます:

fig = plt.figure()
ax = fig.add_subplot(221)
plt.plot(x,y)

ax = fig.add_subplot(222)
plt.plot(x,z)
...

plt.show()

3

Pandasをまったく使用する必要がない場合もあります。これは猫の頻度のmatplotlibプロットです:

ここに画像の説明を入力してください

x = np.linspace(0, 2*np.pi, 400)
y = np.sin(x**2)

f, axes = plt.subplots(2, 1)
for c, i in enumerate(axes):
  axes[c].plot(x, y)
  axes[c].set_title('cats')
plt.tight_layout()

1

上記の@joris応答に基づいて、サブプロットへの参照をすでに確立している場合は、その参照も使用できます。例えば、

ax1 = plt.subplot2grid((50,100), (0, 0), colspan=20, rowspan=10)
...

df.plot.barh(ax=ax1, stacked=True)

0

長い(整然とした)データを含むデータフレームのディクショナリから複数のプロットを作成する方法

  • 仮定

    • きちんとしたデータの複数のデータフレームの辞書があります
      • ファイルから読み込んで作成
      • 単一のデータフレームを複数のデータフレームに分割して作成
    • カテゴリはcat重複している可能性がありますが、すべてのデータフレームにcat
    • hue='cat'
  • データフレームは繰り返し処理されているため、各プロットで色が同じようにマッピングされるとは限りません

    • 'cat'すべてのデータフレームの一意の値からカスタムカラーマップを作成する必要があります
    • 色は同じになるので、すべてのプロットの凡例ではなく、プロットの横に1つの凡例を配置します

インポートと合成データ

import pandas as pd
import numpy as np  # used for random data
import random  # used for random data
import matplotlib.pyplot as plt
from matplotlib.patches import Patch  # for custom legend
import seaborn as sns
import math import ceil  # determine correct number of subplot


# synthetic data
df_dict = dict()
for i in range(1, 7):
    np.random.seed(i)
    random.seed(i)
    data_length = 100
    data = {'cat': [random.choice(['A', 'B', 'C']) for _ in range(data_length)],
            'x': np.random.rand(data_length),
            'y': np.random.rand(data_length)}
    df_dict[i] = pd.DataFrame(data)


# display(df_dict[1].head())

  cat         x         y
0   A  0.417022  0.326645
1   C  0.720324  0.527058
2   A  0.000114  0.885942
3   B  0.302333  0.357270
4   A  0.146756  0.908535

カラーマッピングを作成してプロットする

# create color mapping based on all unique values of cat
unique_cat = {cat for v in df_dict.values() for cat in v.cat.unique()}  # get unique cats
colors = sns.color_palette('husl', n_colors=len(unique_cat))  # get a number of colors
cmap = dict(zip(unique_cat, colors))  # zip values to colors

# iterate through dictionary and plot
col_nums = 3  # how many plots per row
row_nums = math.ceil(len(df_dict) / col_nums)  # how many rows of plots
plt.figure(figsize=(10, 5))  # change the figure size as needed
for i, (k, v) in enumerate(df_dict.items(), 1):
    plt.subplot(row_nums, col_nums, i)  # create subplots
    p = sns.scatterplot(data=v, x='x', y='y', hue='cat', palette=cmap)
    p.legend_.remove()  # remove the individual plot legends
    plt.title(f'DataFrame: {k}')

plt.tight_layout()
# create legend from cmap
patches = [Patch(color=v, label=k) for k, v in cmap.items()]
# place legend outside of plot; change the right bbox value to move the legend up or down
plt.legend(handles=patches, bbox_to_anchor=(1.06, 1.2), loc='center left', borderaxespad=0)
plt.show()

ここに画像の説明を入力してください

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.