PandasのDataFrame型とSeries型の備忘録
サンプルデータ
import pandas as pd group1 = [4, 9, 10, 11, 12, 13, 13, 15, 18, 18, 20] group2 = [16, 16, 17, 19, 19, 22, 22, 23, 25]
DataFrame型
DataFrame(データフレーム)型は表(テーブル)形式の2次元データ。
addf = pd.DataFrame({"AVAL":group1 + group2 ,"TRT01A":["group1"] * len(group1) + ["group2"] * len(group2) })
↓中身
addf.head(5) Out[1]: AVAL TRT01A 0 4 group1 1 9 group1 2 10 group1 3 11 group1 4 12 group1 type(addf) Out[2]: pandas.core.frame.DataFrame
Series型
Series(シリーズ)型は1列または1行の1次元データ。
adsr = pd.Series(data=group1, index=range(1,len(group1)+1))
↓ 中身
adsr.head(5) Out[1]: 1 4 2 9 3 10 4 11 5 12 dtype: int64 type(adsr2) Out[2]: pandas.core.series.Series
DataFrame型データを1列取り出すと1次元データになるので、Series型と認識される。
adsr2 = addf.loc[addf["TRT01A"]=="group1", "AVAL"]
↓ 中身
adsr2.head(5) Out[86]: 0 4 1 9 2 10 3 11 4 12 Name: AVAL, dtype: int64 type(adsr2) Out[87]: pandas.core.series.Series