分散共分散行列の定義と性質

更新 2025/10/08

分散共分散行列とは，分散（散らばり具合を表す指標）を多次元の確率変数に拡張したもの

分散共分散行列の定義からはじめて，具体例や半正定値になることなどをわかりやすく説明します。

確率変数が2つの場合の定義

分散共分散行列の定義（2次元）

確率変数 $X_1,X_2$ に対して，分散共分散行列（単に共分散行列とも言う） $\Sigma$ を以下で定める： $\Sigma=\begin{pmatrix}\sigma_{1}^2&\sigma_{12}\\\sigma_{12}&\sigma_{2}^2\end{pmatrix}$ ただし， $\sigma_{1}^2$ は $X_1$ の分散， $\sigma_{2}^2$ は $X_2$ の分散， $\sigma_{12}$ は $X_1$ と $X_2$ の共分散。

つまり，分散共分散行列は「対角成分が分散」で「非対角成分が共分散」である行列です。

参考：→共分散の意味と簡単な求め方

確率変数が $n$ 個の場合も同様です。

分散共分散行列の定義

$n$ 個の確率変数 $X_1,X_2,\dots , X_n$ に対して，

$ii$ 成分が $\sigma_{i}^2$
$ij$ 成分（ $i\neq j$ ）が $\sigma_{ij}$

である $n\times n$ 行列を分散共分散行列と言う。

分散共分散行列は，データの散らばり具合や相関という情報を集約したものともいえます。

補足：データの分散共分散行列

ここまでは「複数の確率変数」に対して定まる分散共分散行列を紹介しました。

同様に，「 $n$ 次元のデータ」に対しても分散共分散行列が定義されます。特に，標本分散共分散行列といいます（対角成分には標本分散，非対角成分には標本共分散が並ぶ）。

具体例

例題

データとして， $(x_i,y_i)=(40,80),(80,90),(90,100)$ が与えられたとき，このデータの（標本）分散共分散行列を求めよ。

例えば $x_i$ が $i$ 番目の人の国語の点数， $y_i$ が数学の点数と思って下さい。

解答

$E[X]=70,E[Y]=90$ であり，偏差ベクトル（平均からの差）は $(-30,-10),(10,0),(20,10)$

よって $\sigma_X^2=\dfrac{1}{3}\{(-30)^2+10^2+20^2\}=\dfrac{1400}{3}$ $\sigma_Y^2=\dfrac{1}{3}\{(-10)^2+10^2\}=\dfrac{200}{3}$ $\sigma_{XY}=\dfrac{1}{3}(300+200)=\dfrac{500}{3}$ 分散共分散行列は， $\Sigma=\begin{pmatrix}\dfrac{1400}{3}&\dfrac{500}{3}\\ \dfrac{500}{3}&\dfrac{200}{3}\end{pmatrix}$

注：共分散は負になることがあるので，分散共分散行列の要素（非対角成分）が負になることもあります。

別の表現

分散と共分散の定義を思い出してみると，
分散共分散行列の第 ijijij 成分は E[(Xi−μi)(Xj−μj)]E[(X_i-\mu_{i})(X_j-\mu_{j})]E[(Xi​−μi​)(Xj​−μj​)] と書ける
ことが分かります。
ただし
μi\mu_{i}μi​
 は
XiX_iXi​
 の平均です。
この表現を使うことで，対角成分と非対角成分を場合分けせずに統一的に扱えます。
分散共分散行列の定義（別の言い方）
nnn
 個の確率変数
X1,X2,…,XnX_1,X_2,\dots , X_nX1​,X2​,…,Xn​
 に対して，
第
ijijij
 成分が
E[(Xi−μi)(Xj−μj)]E[(X_i-\mu_{i})(X_j-\mu_{j})]E[(Xi​−μi​)(Xj​−μj​)]
 である
n×nn\times nn×n
 行列を分散共分散行列と言う。

独立な場合

確率変数たちが互いに独立な場合，共分散は全て $0$ になります。（独立なら無相関です）→独立と無相関の意味と違いについて

つまり，分散共分散行列の非対角成分は $0$ になるので，この場合には分散共分散行列は対角行列になります。対角成分には分散（＝固有値）が並びます。

半正定値であること

分散共分散行列は半正定値であるという重要な性質があります。
222
 変数の場合について証明します。一般の
nnn
 次元の場合も全く同様に証明できます。
証明
任意の
222
 次元縦ベクトル
yundefined=(y1,y2)⊤\overrightarrow{y}=(y_1,y_2)^{\top}y​=(y1​,y2​)⊤
 に対して
yundefined⊤Σyundefined≥0\overrightarrow{y}^{\top}\Sigma\overrightarrow{y} \geq 0y​⊤Σy​≥0
つまり
σ12y12+2σ12y1y2+σ22y22≥0\sigma_{1}^2y_1^2+2\sigma_{12}y_1y_2+\sigma_{2}^2y_2^2\geq 0σ12​y12​+2σ12​y1​y2​+σ22​y22​≥0
を示すのが目標。
ここで，新たな確率変数
X=y1X1+y2X2X=y_1X_1+y_2X_2X=y1​X1​+y2​X2​
 というものを考えてみる。
XXX
 の分散が非負であること，分散の公式（注），および共分散の線形性より
0≤Var[y1X1+y2X2]=σ12y12+2σ12y1y2+σ22y220\leq \mathrm{Var}[y_1X_1+y_2X_2]=\sigma_{1}^2y_1^2+2\sigma_{12}y_1y_2+\sigma_{2}^2y_2^20≤Var[y1​X1​+y2​X2​]=σ12​y12​+2σ12​y1​y2​+σ22​y22​
となるので目標の式が証明できた。
注：期待値と分散に関する公式一覧より，
Var[aX]=a2Var[X]\mathrm{Var}[aX]=a^2\mathrm{Var}[X]Var[aX]=a2Var[X]
Var[X1+X2]=Var[X1]+Var[X2]+2σ12\mathrm{Var}[X_1+X_2]=\mathrm{Var}[X_1]+\mathrm{Var}[X_2]+2\sigma_{12}Var[X1​+X2​]=Var[X1​]+Var[X2​]+2σ12​
注：一次元の場合の分散は非負ですが
000
 になることもあります。同様に，分散共分散行列も半正定値ですが正定値とは限りません。

補足

$n$ 次元縦ベクトルとして確率変数を並べたもの： $X=(X_1,X_2,\dots, X_n)^{\top}$
期待値を並べたもの： $\mu=(\mu_{1},\mu_{2},\dots, \mu_{n})^{\top}$

とすれば $\Sigma=E[(X-\mu)(X-\mu)^{\top}]=E[XX^{\top}]-\mu\mu^{\top}$ となります。

真ん中の式より分散共分散行列が半正定値であることが分かります。最右辺は実際の計算に役立ちます。

「ぶんさんきょうぶんさんぎょうれつ」って早口で三回言えますか？

この記事の監修者

マスオ

東京大学大学院情報理工学系研究科修了／2014年にWebサイト『高校数学の美しい物語』を立ち上げ／著書累計 50,000部突破／「わかりやすいこと」と「ごまかさないこと」の両立を意識している。 →著者情報・書籍一覧を見る