分散分析
※SAS,SPSS,TSPの例はありません.
SASで分析する SPSSで分析する TSPで分析する EXCELで分析する
分散分析の必要性
2つのグループ(水準)の平均の違いを調べる方法がt検定といわれる方法でした.ところで,グループ数が3つ(例えばA,B,C)になったらどうしたらよいでしょう.
AとB,BとC,そしてCとAのペアでそれぞれt検定を行ない,どこかで帰無仮説が棄却されたならば,3つのグループの平均は等しくない,と結論づけることができます.
ですが,このやり方には欠点があります.
と,いうわけで(1)に限ってみてもt検定の繰り返しは面倒です.そこで,グループ(水準)が3つ以上の場合に,変数の各水準の母平均に違いがあるかどうかを「分散」の大きさの違いで検定を行なうものを分散分析(Analysis of Varience)といいます.
- グループ数が増加するとペアの数が増加する
グループの数をAとすると,ペアの数はA*(A-1)/2となります.疲れます.- 有意水準の解釈が難しくなる
ここでは省略します.統計の本を参照して下さい.
厳密には3つ以上の水準の平均が互いに等しいという仮説を検定するもので,水準の間で少なくとも1つの平均が他と異なっているかどうかをこの分析では調べることになります.つまり,全体の中のどこかに差が存在していることを示すだけで,具体的にどれとどれが異なっているかを知るには,多重比較という分析を行なう必要があります.多重比較はt統計分析ソフトの分散分析におけるオプションとして与えられることが多いようです.
また,分散分析では検定統計量がF分布という分布に従うことが知られていることを利用して検定を行ないます.
分散分析の種類
分散分析には大きく分けて一元配置と多元配置(二元配置)といわれる分析方法があります.
一元配置
例えば,3カ国の男性の平均身長の違いは国籍に関係あるのかといった場合,国籍がグループを識別する(唯一の)要素になります.このように,グループを識別する要素が1つのものを一元配置のデータと呼び,これのデータを用いた分散分析を一元配置の分散分析といいます.
アメリカ フランス 日 本 ○○cm ○○cm ○○cm 二元配置
先のデータに対し,「父親の身長が高いか高くないか」という要素を加えて,各人を2つの要素(国籍と父親の身長)で識別できるようになっているものを二元配置のデータといいます.これを用いた分散分析を二元配置の分散分析といいます.
アメリカ フランス 日 本 父親の身長高い ○○cm ○○cm ○○cm 父親の身長低い ○○cm ○○cm ○○cm この分析では例のデータを考えた場合,分析の目的は,
という3つになります.3つめのことを「交互作用」と呼んでいます.
- 国籍によって平均身長に違いはあるのか
- 父親の身長の高低によって平均身長に違いはあるのか
- 2つの要素による相乗効果はあるのか
多元配置
より多くのグループ分けの要素からなる分散分析です.詳しくは統計のテキストを見て下さい.
SASで分析する SPSSで分析する TSPで分析する EXCELで分析する
戻る