スポンサーリンク

相関係数の問題の解法

相関係数を求める問題の解法です。

基本問題

次のデータの相関係数を求めなさい。

x576429
y773247

解き方

定義に従って相関係数を求めます。

相関係数は1が正の相関関係で右上がり、-1が負の相関関係で右下がりになります。
これは平均値の点から水平、垂直に線を引いて、データを4つのエリアに分割するとわかりやすくなります
平均値よりも双方の値が大きい、もしくは小さいものは、平均値との差の積が正です。
平均値よりも大きい値と小さい値のペアになっているものは、平均値との差の積が負です。

それぞれの分散を求めます。
共分散を求めます。
共分散をそれぞれの分散の積で割った値が相関係数になります。

解説

次のデータの相関係数を求めなさい。

x576429
y773247

まずそれぞれの分散を求めます。
(i)xの分散
平均値は、\displaystyle \frac{5+7+6+4+2+9}{6}=\frac{33}{6}=5.5です。
分散は、それぞれの二乗から平均値の二乗を引く方法で求めましょう。
\displaystyle s_{x}=\frac{5^2+7^2+6^2+4^2+2^2+9^2}{6}-5.5^2=\frac{25+49+36+16+4+81}{6}-30.25
\displaystyle =\frac{211}{6}-30.25 \fallingdotseq 35.17-30.25=4.92

(ii)yの分散
平均値は、\displaystyle \frac{7+7+3+2+4+7}{6}=\frac{30}{6}=5です。
分散は、それぞれの二乗の平均値から平均値の二乗を引く方法で求めましょう。
\displaystyle s_{y}=\frac{7^2+7^2+3^2+2^2+4^2+7^2}{6}-5^2=\frac{49+49+9+4+16+49}{6}-25
\displaystyle =\frac{176}{6}-25 \fallingdotseq 29.33-25=4.33

(iii)共分散
データのペアで計算を進めます。
s_{xy}=(5-5.5)(7-5)+(7-5.5)(7-5)+(6-5.5)(3-5)+(4-5.5)(2-5)+(2-5.5)(4-5)+(9-5.5)(7-5)
=(-0.5)(2)+(1.5)(2)+(0.5)(-2)+(-1.5)(-3)+(-3.5)(-1)+(3.5)(2)
=-1+3+-1+4.5+3.5+7
=18-2=16

よって相関係数rは
\displaystyle r=\frac{s_{xy}}{s_xs_y}
\fallingdotseq \frac{16}{4.92\cdot 4.33}\fallingdotseq 0.75
1に近い正の相関が強いデータであると言えるでしょう。

なお、強いとか、弱いとかは明確に定めてはいないでしょう。
テストでこの強弱を問われることは無いと思います。
ただ、正負を問われますので、右上がりか右下がりか、どちらの傾向があるという事は読み取れる必要があります。

終わりに

分散、標準偏差同様、とにかく定義通りに計算を行えるかどうかです。
相関係数は二つのデータの間に関係性があるのかどうかを数学的に表すことができます。
相関係数までくると、データの分析をしている感覚が得られますね。

にほんブログ村 地域生活(街) 東北ブログへ にほんブログ村 地域生活(街) 東北ブログ 米沢情報へ にほんブログ村 教育ブログへ にほんブログ村 教育ブログ 塾教育へ
スポンサーリンク