判別分析(discriminant analysis)

ある2つのグループ(例えば健康な人と病気の人のグループ)について,いくつかの変数(例えば血液検査における幾つかの数値)が与えられているとき,この2つのグループの間に境界線を入れ,新しいサンプルがどちらのグループに入るのかを判別するための手法を判別分析といいます.判別分析のプログラムを実行すると境界線(判別関数)が得られます.この判別関数に新しいサンプルの数値を代入し,どちらのグループに属するのかを判定します.

判別関数には直線による線形判別関数(Linear discriminant function)と曲線によるマハラノビス汎距離(Mahalanobis' generalized distance)があります.

どちらの判別関数を用いるべきかは2つのグループの分散共分散行列の相等性の検定で得ることができます.また,判別関数に用いる変数が判別に役立っているかについてはWilksのΛ統計量を用います.これらの統計量は判別分析のプログラムの実行で得ることができます.

3つ以上のグループの判別も可能です.これは重判別分析(multiple discriminant analysis)といいます.これも判別分析のプログラムで得られます.

最後に,判別分析はグループを完全に分類できるものではないことに注意してください.判別率,誤判別率を考慮することはとても重要といえるでしょう.


SASで分析する SPSSで分析する
TSPで分析するEXCELで分析する


戻る