1. 高校数学の美しい物語
  2. 相関行列の定義と分散共分散行列との関係

相関行列の定義と分散共分散行列との関係

更新日時 2021/03/07
目次
  • 相関行列とは

  • 分散共分散行列との関係1

  • 分散共分散行列との関係2

  • 半正定値であること

相関行列とは

確率変数に対する相関行列

nn 個の確率変数 X1,X2,,XnX_1,X_2,\cdots,X_n に対して,

iiii 成分が 11ijij 成分が ρij\rho_{ij}XiX_iXjX_j の相関係数)

であるような n×nn\times n 行列 CC を相関行列と言います。定義より,相関行列は非対角成分が 1-1 以上 11 以下であるような対称行列です。

注:「iji\neq j」という文言は省略します。

データに対する標本相関行列

同様に,nn 次元のデータに対しても(標本)相関行列が定義されます(対角成分には 11,非対角成分には標本相関係数が並ぶ)。

分散共分散行列との関係1

確率変数 X1,X2,,XnX_1,X_2,\cdots, X_n に対する相関行列 CC は,

XiX_i たちをスケール変換した)確率変数 X1σ1,X2σ2,,Xnσn\dfrac{X_1}{\sigma_1},\dfrac{X_2}{\sigma_2},\cdots,\dfrac{X_n}{\sigma_n} に対する分散共分散行列 Σ\Sigma' と一致します(σi\sigma_iXiX_i の標準偏差)。

実際,CCiiii 成分は 11Σ\Sigma'iiii 成分は Xiσi\dfrac{X_i}{\sigma_i} の分散なので 11 となり一致します。 CCijij 成分は ρij\rho_{ij}Σ\Sigma'ijij 成分は Xiσi\dfrac{X_i}{\sigma_i}Xjσj\dfrac{X_j}{\sigma_j} の共分散なので Cov(Xi,Xj)σiσj=ρij\dfrac{\mathrm{Cov}(X_i,X_j)}{\sigma_i\sigma_j}=\rho_{ij} となり一致します。

分散共分散行列との関係2

確率変数 X1,X2,,XnX_1,X_2,\cdots, X_n に対する相関行列 CC と分散共分散行列 Σ\Sigma の間には C=DΣDC=D\Sigma D という関係が成り立ちます。ただし,DDiiii 成分が 1σi\dfrac{1}{\sigma_i} であるような対角行列です。

この関係式は成分計算で簡単に確認できます。

2次元の場合の例

(1ho12ho121)=(1σ1001σ2)(σ12σ12σ12σ22)(1σ1001σ2)\begin{pmatrix}1&ho_{12}\\ho_{12}&1\end{pmatrix}=\begin{pmatrix}\dfrac{1}{\sigma_1}&0\\0&\dfrac{1}{\sigma_2}\end{pmatrix}\begin{pmatrix}\sigma_1^2&\sigma_{12}\\\sigma_{12}&\sigma_2^2\end{pmatrix}\begin{pmatrix}\dfrac{1}{\sigma_1}&0\\0&\dfrac{1}{\sigma_2}\end{pmatrix}

半正定値であること

相関行列は半正定値です。これは分散共分散行列が半正定値であることと「分散共分散行列との関係2」から分かります。

証明

任意の nn 次元縦ベクトル yy に対して yCy0y^{\top}Cy\geq 0 を示すのが目標。

さきほどの関係式より,

yCy=yDΣDy=(Dy)Σ(Dy)y^{\top}Cy=y^{\top}D\Sigma Dy\\ =(Dy)^{\top}\Sigma (Dy)

これは Σ\Sigma が半正定値であることから 00 以上である。

分散共分散行列を Σ\Sigma で表すのは一般的ですが,相関行列にはどの記号を用いるのが適切か迷いました。correlation matrixの頭文字 CC を使いましたが,異論がある方はご一報ください。

人気記事
  1. 高校数学の美しい物語
  2. 相関行列の定義と分散共分散行列との関係