【Python】DataFrame型とSeries型

PandasのDataFrame型とSeries型の備忘録

サンプルデータ


import pandas as pd
group1 = [4, 9, 10, 11, 12, 13, 13, 15, 18, 18, 20]
group2 = [16, 16, 17, 19, 19, 22, 22, 23, 25]


DataFrame型


DataFrame(データフレーム)型は表(テーブル)形式の2次元データ。

addf = pd.DataFrame({"AVAL":group1 + group2
                    ,"TRT01A":["group1"] * len(group1) + ["group2"] * len(group2) })

↓中身

addf.head(5)
Out[1]: 
   AVAL  TRT01A
0     4  group1
1     9  group1
2    10  group1
3    11  group1
4    12  group1
 
type(addf)
Out[2]: pandas.core.frame.DataFrame



Series型


Series(シリーズ)型は1列または1行の1次元データ。

adsr = pd.Series(data=group1, index=range(1,len(group1)+1))

↓ 中身

adsr.head(5)
Out[1]: 
1     4
2     9
3    10
4    11
5    12
dtype: int64
 
type(adsr2)
Out[2]: pandas.core.series.Series


DataFrame型データを1列取り出すと1次元データになるので、Series型と認識される。

adsr2 = addf.loc[addf["TRT01A"]=="group1", "AVAL"]

↓ 中身

adsr2.head(5)
Out[86]: 
0     4
1     9
2    10
3    11
4    12
Name: AVAL, dtype: int64

type(adsr2)
Out[87]: pandas.core.series.Series
本ブログは個人メモです。 本ブログの内容によって生じた損害等の一切の責任を負いかねますのでご了承ください。