Pythonの新機能。
Rでは、dim(...)を使用して行列の次元を取得できます。Python Pandasのデータフレームに対応する関数は何ですか?
Pythonの新機能。
Rでは、dim(...)を使用して行列の次元を取得できます。Python Pandasのデータフレームに対応する関数は何ですか?
回答:
DataFrameまたはシリーズの属性に関する情報を取得する方法はいくつかあります。
サンプルのDataFrameとシリーズを作成する
df = pd.DataFrame({'a':[5, 2, np.nan], 'b':[ 9, 2, 4]})
df
a b
0 5.0 9
1 2.0 2
2 NaN 4
s = df['a']
s
0 5.0
1 2.0
2 NaN
Name: a, dtype: float64
shape 属性このshape属性は、DataFrameの行数と列数の2項目のタプルを返します。シリーズの場合、1項目のタプルを返します。
df.shape
(3, 2)
s.shape
(3,)
len 関数DataFrameの行数を取得したり、Seriesの長さを取得したりするには、len関数を使用します。整数が返されます。
len(df)
3
len(s)
3
size 属性DataFrameまたはSeriesの要素の総数を取得するには、size属性を使用します。DataFrameの場合、これは行数と列数の積です。シリーズの場合、これは次のlen関数と同等になります。
df.size
6
s.size
3
ndim 属性このndim属性は、DataFrameまたはシリーズの次元数を返します。DataFrameの場合は常に2、Seriesの場合は1になります。
df.ndim
2
s.ndim
1
count方法このcountメソッドを使用して、DataFrameの各列/行の欠落していない値の数を返すことができます。ほとんどの人は通常、カウントを各行の長さとして考えているので、これは非常に混乱する可能性がありますが、そうではありません。DataFrameで呼び出されると、インデックス内の列名と欠落していない値の数を値として持つシリーズが返されます。
df.count() # by default, get the count of each column
a 2
b 3
dtype: int64
df.count(axis='columns') # change direction to get count of each row
0 2
1 2
2 1
dtype: int64
シリーズの場合、計算用の軸は1つしかないため、スカラーを返すだけです。
s.count()
2
infoメタデータを取得する方法を使用するこのinfoメソッドは、各列の欠落していない値とデータ型の数を返します
df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 2 columns):
a 2 non-null float64
b 3 non-null int64
dtypes: float64(1), int64(1)
memory usage: 128.0 bytes