パンダのドキュメントからhttp://pandas.pydata.org/pandas-docs/stable/dsintro.html
Seriesは、任意のデータ型を保持できる1次元のラベル付き配列です。パンダシリーズの形式でデータを読み取るには:
import pandas as pd
ds = pd.Series(data, index=index)
DataFrameは、潜在的に異なるタイプの列を持つ2次元のラベル付きデータ構造です。
import pandas as pd
df = pd.DataFrame(data, index=index)
上記の両方のインデックスにリストがあります
例:次のデータを含むcsvファイルがあります。
,country,popuplation,area,capital
BR,Brazil,10210,12015,Brasile
RU,Russia,1025,457,Moscow
IN,India,10458,457787,New Delhi
上記のデータをシリーズおよびデータフレームとして読み取るには:
import pandas as pd
file_data = pd.read_csv("file_path", index_col=0)
d = pd.Series(file_data.country, index=['BR','RU','IN'] or index = file_data.index)
出力:
>>> d
BR Brazil
RU Russia
IN India
df = pd.DataFrame(file_data.area, index=['BR','RU','IN'] or index = file_data.index )
出力:
>>> df
area
BR 12015
RU 457
IN 457787