歪度,尖度の定義と意味

確率変数 XX が従う分布の尖度,歪度を以下のように定義する:

歪度:E[(Xμ)3]σ3\dfrac{E[(X-\mu)^3]}{\sigma^3}

尖度:E[(Xμ)4]σ43\dfrac{E[(X-\mu)^4]}{\sigma^4}-3

統計学における歪度・尖度の定義と意味を解説します。

この記事では確率分布の平均を μ\mu,標準偏差を σ\sigma (分散は σ2\sigma^2)とします。

歪度,尖度の定義について

  • 分布の特徴を表す指標としては平均 μ\mu や分散 σ2\sigma^2 が有名ですが,それだけではありません。この記事では歪度,尖度という量を紹介します。
  • 平均や分散が存在しない分布がある(→コーシー分布とその期待値などについて)ことからも分かるように,歪度や尖度が存在しない分布もあります。
  • 尖度に3-3 がついているのは正規分布の尖度が 00 になるように調整するためです。尖度の定義に3-3 をつけない流儀もあります。

歪度の意味

歪度(わいど)は平均まわりの三次モーメントを標準偏差で正規化したもので, 分布の歪み具合(どれくらい非対称なのか)を表します。

歪度の意味

(単峰型の分布について,一般的に)

  • 歪度が正のときやや左側にコブ
  • 歪度が 00 のとき左右対称
  • 歪度が負のときにやや右側にコブ

です。平均から遠いところが E[(Xμ)3]E[(X-\mu)^3] に大きく寄与するので,

左側にコブがある
    \iff 右側に大きく離れたやつがいる
    E[(Xμ)3]>0\iff E[(X-\mu)^3] > 0

となりやすいわけです。

尖度の意味

尖度(せんど)は平均まわりの四次モーメントを標準偏差で正規化したものです。分布の尖り具合,あるいは分布の裾の重さを表す指標です。

期待値と分散が同じ2つの分布を比較したときに,

  • 尖度が大きい方が「ピークが鋭い」「端っこでゆるやかに減少」する傾向があります。
  • 尖度が小さい方が「ピークがつぶれている」「端っこで急激に減少」する傾向があります。

特に,以下に示すように正規分布では尖度が 00 なので,尖度の符号を見れば正規分布より尖っているかつぶれているかが分かります。

正規分布の尖度の導出

後述のように一次変換に関して不変なので,平均 11,分散 00 の正規分布で考える。尖度は,

x42πex22dx3\displaystyle\int_{-\infty}^{\infty}\dfrac{x^4}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}dx-3

である。ここで,ガウス積分の公式の公式5: x4eax2dx=34πa5\displaystyle\int_{-\infty}^{\infty}x^4e^{-ax^2}dx=\dfrac{3}{4}\sqrt{\dfrac{\pi}{a^5}}a=12a=\dfrac{1}{2} とすると,尖度は 12π×3425π13=0\dfrac{1}{\sqrt{2\pi}}\times\dfrac{3}{4}\sqrt{\dfrac{2^5\pi}{1}}-3=0 となる。

一次変換に関して不変

歪度,尖度は σ\sigma で正規化しているため, 定数倍や平行移動で値が変わりません。

XX が従う分布の歪度,尖度は aX+baX+b が従う分布の歪度,尖度と等しい。

平行移動と定数倍で E[(xμ)n]σn\dfrac{E[(x-\mu)^n]}{\sigma^n} が不変であることを示します。

証明の概略

・平行移動について

平行移動しても E[(Xμ)n]E[(X-\mu)^n]σ\sigma の値はともに変わらない。

・定数倍について

確率変数 XX に対して aXaX を考えると,

E[(aXaμ)n]=anE[(Xμ)n]E[(aX-a\mu)^n]=a^nE[(X-\mu)^n]

また,標準偏差は aa 倍されるので σn\sigma^nana^n 倍される。

尖度(せんど)のことを「とがりど」と読む人も見たことがあります。