Python-データフレームの次元


85

Pythonの新機能。

Rでは、dim(...)を使用して行列の次元を取得できます。Python Pandasのデータフレームに対応する関数は何ですか?


2
DataFramesとSeriesのディメンション情報を取得するすべての方法の詳細な概要については、以下の回答を参照してください
Ted

回答:



24

DataFrameまたはシリーズのディメンションに関する情報を取得するためのすべての方法の概要

DataFrameまたはシリーズの属性に関する情報を取得する方法はいくつかあります。

サンプルのDataFrameとシリーズを作成する

df = pd.DataFrame({'a':[5, 2, np.nan], 'b':[ 9, 2, 4]})
df

     a  b
0  5.0  9
1  2.0  2
2  NaN  4

s = df['a']
s

0    5.0
1    2.0
2    NaN
Name: a, dtype: float64

shape 属性

このshape属性は、DataFrameの行数と列数の2項目のタプルを返します。シリーズの場合、1項目のタプルを返します。

df.shape
(3, 2)

s.shape
(3,)

len 関数

DataFrameの行数を取得したり、Seriesの長さを取得したりするには、len関数を使用します。整数が返されます。

len(df)
3

len(s)
3

size 属性

DataFrameまたはSeriesの要素の総数を取得するには、size属性を使用します。DataFrameの場合、これは行数と列数の積です。シリーズの場合、これは次のlen関数と同等になります。

df.size
6

s.size
3

ndim 属性

このndim属性は、DataFrameまたはシリーズの次元数を返します。DataFrameの場合は常に2、Seriesの場合は1になります。

df.ndim
2

s.ndim
1

トリッキーなcount方法

このcountメソッドを使用して、DataFrameの各列/行の欠落していない値の数を返すことができます。ほとんどの人は通常、カウントを各行の長さとして考えているので、これは非常に混乱する可能性がありますが、そうではありません。DataFrameで呼び出されると、インデックス内の列名と欠落していない値の数を値として持つシリーズが返されます。

df.count() # by default, get the count of each column

a    2
b    3
dtype: int64


df.count(axis='columns') # change direction to get count of each row

0    2
1    2
2    1
dtype: int64

シリーズの場合、計算用の軸は1つしかないため、スカラーを返すだけです。

s.count()
2

infoメタデータを取得する方法を使用する

このinfoメソッドは、各列の欠落していない値とデータ型の数を返します

df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 2 columns):
a    2 non-null float64
b    3 non-null int64
dtypes: float64(1), int64(1)
memory usage: 128.0 bytes
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.