数学の質問です。
相関係数は相関の強弱を表して居ると教科書にありましたが、なぜ相関係数は共分散を標準偏差、の積で割って求められるのでしょうか?なぜで割る必要があるのでしょうか?の範囲をにするためにで割るのでしょうか?
回答宜しく願います。
ベストアンサー
理由1:
共分散の値は変数のスケールに依存します。つまり、変数が大きな値を持つ場合、共分散も大きくなります。相関係数は共分散をそれぞれの変数の標準偏差で割ることで、このスケール依存性を排除します。結果として、相関係数は常に-1から1の範囲の値を取り、これにより異なるペアの変数間の相関の強さを公平に比較することが可能になります。
理由2:
共分散は二つの変数の単位の積として表されます。たとえば、身長と体重の共分散は「cm・kg」となります。これらの単位は解釈が難しい場合があります。それに対して、相関係数は標準偏差で割ることにより単位を取り除き、無次元の比率として結果を提供します。
相関係数は共分散をそれぞれの変数の標準偏差で割ることで、このスケール依存性を排除します。
→何を言いたいのかは分かったのですが、なぜ共分散をそれぞれの変数の標準偏差で割ることで、スケール依存性を排除できるのですか?
(それ以外は分かりました。ありがとうございます!)
相関係数は共分散をそれぞれの変数の標準偏差の積で割ったものですが、標準偏差の積の値は共分散の値に依存します。
共分散の絶対値が最大になるとき、その値は標準偏差の積の値と等しくなるので、相関係数の値は必ず -1 から 1 の範囲になります。
このことにより、相関係数は変数のスケールに依存しない、2つの変数の関連性の強さを示す指標として解釈できるようになります。
なお、相関係数がスケール変換に対して不変であることの数学的な証明については、下記のサイトを参照してください。
相関係数は共分散をそれぞれの変数の標準偏差の積で割ったものですが、標準偏差の積の値は共分散の値に依存します。
→標準偏差の積の値が共分散の値に依存するとはどういうことでしょうか?
共分散の絶対値が最大になるとき、その値は標準偏差の積の値と等しくなるので、相関係数の値は必ず -1 から 1 の範囲になります。
→共分散の絶対値が最大になる時、その値が標準偏差の積の値と等しくなるのはなぜですか?
ん~、ごめんなさい、自分の語彙力のせいで、言いたいことが上手く伝わって居ない感じですかね、、、
例えば、分散に就いては「このデータの散ら張りってどうな感じなんだろう?平均に近い値が多い?それとも平均から離れて居る値が多い?それじゃあ、データの各値から平均値を引いた偏差と言うものを考えよう!偏差を考えれば平均に近いか平均から離れて居るか分かる!あ、でも、偏差の平均を考えるとになってしまう、、、じゃあ、偏差の二乗の平均(分散)を考えよう!そうすれば、常に以上になるし、分散の値が大きければ大きいほど平均から離れたデータが多いと言うことが分かる!」と言う感じの発想で偏差の二乗の平均を考えたのだと思うのですが、相関係数はどのような発想で共分散を標準偏差の積で割ることにしたのでしょうか?
「そうすれば、常に以上になるし、」と言う部分は蛇足ですね、、、結果的に偶然そうなるだけですね、、、
共分散の値は変数のスケールに依存します。つまり、変数が大きな値を持つ場合、共分散も大きくなります。共分散を標準偏差の積で割れば、その値は -1 から 1 の範囲に限定されるため、このスケール依存性を排除することができます。これにより異なるペアの変数間の関係の強さを公平に比較することが可能になります。
相関係数が -1 以上 1 以下になることの証明については、上でも紹介した下記サイトを参照してください。
質問者からのお礼コメント
大変助かりました😄