【統計】t検定

2標本の平均の差の検定(t検定)について。

【目次】

帰無仮説、対立仮設


群間の平均に差があるかどうかを評価する。
帰無仮設の「群aと群bの平均に差がない」は「平均の差がゼロである」。

 

計算式等


t検定には、等分散を仮定した「Student's t-test」と等分散を仮定しない「Welch's t-test」があり、次の式で算出されたt値(t統計量)をもとに、t分布を用いて検定を行う。

Student's t-test 

\qquad \begin{aligned}\\ t=\dfrac{\overline{x}_{a}-\overline{x}_{b}}{s_{ab}\sqrt{\dfrac{1}{n_{a}}+\dfrac{1}{n_{b}}}}\end{aligned}

\qquad \begin{aligned}\\ s_{ab}^{2}=\dfrac{\left( n_{a}-1\right) s_{a}^{2}+\left( n_{b}-1\right) s_{b}^{2}}{n_{a}+n_{b}-2}=\dfrac{\sum \left( x_{ai}-\overline{x}_{a}\right) ^{2}+\sum \left( x_{bi}-\overline{x}_{b}\right) ^{2}}{n_{a}+n_{b}-2}\end{aligned}

 s_{i} =標本標準偏差
 s_{ab} ^{2} =プールした分散(各群の平方和を全体の自由度で割ったもの)

 

Welch's t-test 

\qquad t=\dfrac{\overline{x}_{a}-\overline{x}_{b}}{\sqrt{\dfrac{s_{a}^2}{n_{a}}+\dfrac{s_{b}^2}{n_{b}}}}

Welchでは自由度の計算が複雑になり、次のようになる。

\qquad f=\dfrac{\left( g_{a}+g_{b}\right) ^{2}}{\dfrac{g_{a}^{2}}{\left( n_{a}-1\right) }+\dfrac{g_{b}^{2}}{\left( n_{b}-1\right) }}

\qquad \begin{aligned}g_{a}=\dfrac{s_{a}^{2}}{n_{a}},\quad g_{b}=\dfrac{s_{b}^{2}}{n_{b}}\end{aligned}

 

t検定で算出されるp値は、t値が大きいほど小さくなる。
t値の計算式の通り、t値を大きくする要因には次の3つ。

  • 平均の差が大きい
  • 分散が小さい
  • サンプルサイズが大きい

 

プログラムコード


Rのコード

t.test(x, y, var.equal=T) #-- var.equal=TRUE: Student, FALSE: Welch

SASのコード

proc ttest data=ADS1;
  class CLASS1;
  var VAR1;
  ods output TTests = OUTDS; /* Variances="Equal": Student, "Unequal": Welch */
run;

Pythonのコード

from scipy import stats
stats.ttest_ind(x, y, equal_var = True) #-- equal_var=True: Student, False: Welch

 

参考


統計学基礎(出版:東京図書), 日本統計学会編

統計学(出版:東京図書), 日本統計学会編

 


サイトマップ

cochineal19.hatenablog.com

本ブログは個人メモです。 本ブログの内容によって生じた損害等の一切の責任を負いかねますのでご了承ください。