相関係数

2つのデータ群に関連性がある時(例えば,片方が大きいと,もう片方も大きくなるなど),その2つのデータ群には相関があるといいます.

相関の有無は,2つのデータ群を散布図にすることにより見当をつけることができますが,客観的に判定するには2つのデータ群の相関係数をもとめて判断します.相関係数は−1から+1の間の数値をとり,−1,+1の時は完全相関(順に逆相関,正相関)といい,2つのデータ群に強い関連性が存在することと示し,一方,0 の時は無相関といい,2つのデータ群に関連性がないと判断されます.

2つの変数x,yの平均をそれぞれx.gify.gifとすると,相関係数ρは,

corr.gif

で求めることができます.

得られた相関係数のイメージを描くと,以下の図のようになるでしょうか?

【相関=1.0】【相関=−1.0】
corr_p1.gifcorr_m1.gif
【相関=0.597】 
corr_0597.gif完全相関の場合は各要素を直線で結ぶことができます.
正の相関の場合は右上がりの傾向が,負の相関の場合は左上がりの傾向を観察することができます.

一つの目安として,相関係数の大きさ(絶対値)と相関の程度の表現の対応関係は以下のように考えれば良いといわれています.

1.0≧|R|≧0.7:高い相関がある
0.7≧|R|≧0.5:かなり高い相関がある
0.5≧|R|≧0.4:中程度の相関がある
0.4≧|R|≧0.3:ある程度の相関がある
0.3≧|R|≧0.2:弱い相関がある
0.2≧|R|≧0.0:ほとんど相関がない
出典:「社会調査の基礎」放送大学テキスト


SASで分析する SPSSで分析する
TSPで分析する EXCELで分析する


戻る