平均値の検定(t検定)


SASで分析する SPSSで分析する
TSPで分析する EXCELで分析する

※SAS,SPSS,TSPの例はありません.


1.検定とは何か

実際の分析では,行なう前に母集団の特性についてなんらかの予想がなされているのが普通です .こうした仮説が分析で得られた結果(つまり,標本統計量)と整合的であるかを調べるのが仮説検定です.

森田[1974]によれば,仮説検定は以下の手順で行われます.

  1. 検定する仮説を設定する.
  2. 検定で用いる統計量と検定する際の判定基準を決定する.
  3. 標本から検定統計量を計算し,判定基準に照らして仮説の採否を決める.

検定にあたっては実験者の予想を対立仮説,予想に反する仮説を帰無仮説といいます.
実際の検定では,検定は帰無仮説が棄却されるかどうかを調べます .帰無仮説が棄却されるならば,その逆の対立仮説が採択される(すなわち,実験者の予想が的中した)ことになります.

帰無仮説の検定

棄却

対立仮説が真
帰無仮説の検定

採択

帰無仮説が真

仮説が決まったとして,次に問題になるのが棄却・採択する基準です.ここでは検定仮説(帰無仮説)が正しいとして,検定統計量の分布全体を棄却域と採択域に分割し,帰無仮説が棄却域に入る確率を検定の有意水準とします.有意水準は大抵1%や5%といった小さな値を想定します.
検定の際,検定統計量が棄却域に入る,すなわち,検定を行う分布からはめったに生じない事象が発生した,ということにより検定仮説は間違っている(棄却する)となります.
検定統計量が棄却域に入り,仮説を棄却したとき,統計的に有意であるという表現を用います.


2.平均値の検定

標本から求めた標本平均が仮説と等しいかどうかを調べるものです.

2-1.母分散が既知の場合
母平均をμ,母分散をσ ,標本平均をx.gifとすると,

t-test_avg1.gif

は平均0,分散1の標準正規分布に従うことが知られている.ここで,nは標本数である.検定の手順自体は同じなので,具体例については2-2に譲る.

2-2.母分散が未知の場合
大抵の場合,母分散は分からない.ここでは,母集団が正規分布に従っていることが仮定されている .母集団が正規分布である場合,

t-test_avg2.gif

は自由度n-1のt分布に従う ことが知られている.ここで,sは標本標準偏差である.

2-2の例
「男性の身長の平均が170cmである」ことを帰無仮説(H0:μ=170)として検定してみよう.標本数は60,標本平均x.gifは175.8148,標本標準偏差sは8.014とします.

有意水準は5%とする.このとき,自由度53,有意水準5%のtの値をpとすると,|t|>pならば帰無仮説を棄却,|t|≦pならば帰無仮説を採択することになる.

これを式に代入すると,t=5.282となります.

自由度53,有意水準5%のtの値はt分布表より2.006なので ,この5.282という値はさらに確率の小さな事象であることが分かる.したがって,帰無仮説は5%の有意水準で棄却される.これにより,対立仮説が採択され,男性の身長の平均は170cmではない,となります.


3.平均値の差の検定

スチューデントのt分布を使って,2つのサンプルの母平均(母集団の平均)が等しいかどうかを確認する手法です.

例えば,新しい錆止め剤をメーカーが開発して,その効果のほどを確認する際,サンプルを2つのグループ(新しい錆止め剤を塗ったものと,従来の錆止め剤を塗ったもの)に分け,2つのグループでその効果に差が生じているか(例えば1単位面積当たりの錆の数など)を検定します.こうした分析方法を2標本検定と呼んでいます.

一方,3つ以上の平均値を検定する時には分散分析など他の手法を用います.

ところで,2つのグループの分散が等しいかどうかで検定方法が異なります.


3-1.2つのグループの分散が等しいとき

2つグループの標本平均をx.gify.gifし,2つのグループの分散を合算した分散を,

sigma.gif

(m,nはそれぞれのサンプル数です)とすると,

t.gif

が自由度m+n−2のt分布に従うことを利用して検定します.

Excelの「分析ツール」では『分散が等しいと仮定した2標本による検定分析』がそれにあたります.


3-2.2つのグループの分散が異なるとき

上の場合は2つのグループの分散が等しいことを前提としましたが,当然,グループ間で分散が異なるケースがあります.その場合はこちらの分析方法を採用します.

Excelの「分析ツール」では『分散が等しくないと仮定した2標本による検定分析』がそれにあたります.

検定値tはExcelのヘルプにあります.また自由度は近似値を用いることになりますが,これについてもヘルプにあります.この近似値を用いざるを得ない問題をベーレンズ・フィッシャー問題というそうです.Excelで用いられる近似値はその算式を見る限りウェルチ検定のようです.


4.一対の標本を用いたt検定

これは少し特別なケースのt検定でしょうか.Excelのヘルプによれば,『1 つの標本グループをある実験の前後で 2 度検定する場合のように,2 つの観測値に自然な対の関係がある場合は,この形式のt検定を使います.』だそうです.

詳しくはヘルプを見て下さい.


SASで分析する SPSSで分析する
TSPで分析する EXCELで分析する


戻る