分散共分散行列の定義と性質
分散共分散行列とは,分散(散らばり具合を表す指標)を多次元の確率変数に拡張したもの
分散共分散行列の定義からはじめて,具体例や半正定値になることなどをわかりやすく説明します。
確率変数が2つの場合の定義
確率変数が2つの場合の定義
確率変数 に対して,分散共分散行列(単に共分散行列とも言う) を以下で定める: ただし, は の分散, は の分散, は と の共分散。
つまり,分散共分散行列は「対角成分が分散」で「非対角成分が共分散」である行列です。
確率変数が 個の場合も同様です。
個の確率変数 に対して,
- 成分が
- 第 成分()が
である 行列を分散共分散行列と言う。
分散共分散行列は,データの散らばり具合や相関という情報を集約したものともいえます。
補足:データの分散共分散行列
ここまでは「複数の確率変数」に対して定まる分散共分散行列を紹介しました。
同様に,「 次元のデータ」に対しても分散共分散行列が定義されます。特に,標本分散共分散行列といいます(対角成分には標本分散,非対角成分には標本共分散が並ぶ)。
具体例
具体例
データとして, が与えられたとき,このデータの(標本)分散共分散行列を求めよ。
例えば が 番目の人の国語の点数, が数学の点数と思って下さい。
であり,偏差ベクトル(平均からの差)は
よって 分散共分散行列は,
注:共分散は負になることがあるので,分散共分散行列の要素(非対角成分)が負になることもあります。
別の表現
別の表現
分散と共分散の定義を思い出してみると,分散共分散行列の第 成分は と書けることが分かります。
ただし は の平均です。
この表現を使うことで,対角成分と非対角成分を場合分けせずに統一的に扱うことができます。
個の確率変数 に対して,
第 成分が である 行列を分散共分散行列と言う。
独立な場合
独立な場合
確率変数たちが互いに独立な場合,共分散は全て になります。(独立なら無相関)→独立と無相関の意味と違いについて
つまり,分散共分散行列の非対角成分は になるので,この場合には分散共分散行列は対角行列になります。対角成分には分散(=固有値)が並びます。
半正定値であること
半正定値であること
分散共分散行列は半正定値であるという重要な性質があります。
変数の場合について証明します。一般の 次元の場合も全く同様に証明できます。
任意の 次元縦ベクトル に対して
つまり を示すのが目標。
ここで,新たな確率変数 というものを考えてみる。 の分散が非負であること,分散の公式(注),および共分散の線形性より となるので目標の式が証明できた。
注:期待値と分散に関する公式一覧より,
注:一次元の場合の分散は非負ですが になることもあります。同様に,分散共分散行列も半正定値ですが正定値とは限りません。
補足
補足
なお, 次元縦ベクトルとして確率変数を並べたもの: ,
期待値を並べたもの:
とすれば となります。
真ん中の式より分散共分散行列が半正定値であることが分かります。最右辺は実際の計算に役立ちます。
「ぶんさんきょうぶんさんぎょうれつ」って早口で三回言えますか?