相関行列の定義と分散共分散行列との関係
相関行列とは,各成分に相関係数を並べた行列のことです。
相関行列について解説します。
相関係数の復習
相関係数の復習
相関係数とは,2つの確率変数の間の関係を表す数です。
- 相関係数は から の間
- 相関係数が大きい(1に近い)
→ 片方が大きいとき,もう片方も大きい傾向がある - 相関係数が に近い
→ 2つの変数にあまり関係はない - 相関係数が小さい(-1に近い)
→ 片方が大きいとき,もう片方は小さい傾向がある
相関行列とは
相関行列とは
個の変数 に対して,相関行列とは, 成分に と の相関係数 を並べた行列のことです。
例えば の場合,相関行列は のようになります。
-
と の相関係数は です。つまり,相関行列の対角成分は です。
-
相関行列の非対角成分は 以上 以下です。
-
より,相関行列は対称行列です。
-
は互いに相関係数が計算できる「変数」です。具体的には,確率変数または( 組の対応する)データ,例えば 個の説明変数です。後者の場合の相関行列を,特に標本相関行列と言うことがあります。
分散共分散行列との関係1
分散共分散行列との関係1
確率変数 に対する相関行列 は,
( たちをスケール変換した)確率変数 に対する分散共分散行列 と一致します( は の標準偏差)。
実際,
- の 成分は , の 成分は の分散なので となり一致します。
- の 成分は , の 成分は と の共分散なので となり一致します。
分散共分散行列との関係2
分散共分散行列との関係2
確率変数 に対する相関行列 と分散共分散行列 の間には という関係が成り立ちます。ただし, は 成分が であるような対角行列です。
この関係式は成分計算で簡単に確認できます。
半正定値であること
半正定値であること
相関行列は半正定値です。 →半正定値対称行列の意味と性質【固有値・二次形式・分解・小行列式】
これは,分散共分散行列が半正定値であることと「分散共分散行列との関係2」から分かります。
任意の 次元縦ベクトル に対して を示すのが目標。
さきほどの関係式より,
これは が半正定値であることから 以上である。
分散共分散行列を で表すのは一般的ですが,相関行列にはどの記号を用いるのが適切か迷いました。correlation matrixの頭文字 を使いましたが,異論がある方はご一報ください。