標準偏差の意味と分散との違い

標準偏差の意味

標準偏差とは,データの「バラつきの大きさ」「散らばりの大きさ」を表す指標。

  • 標準偏差が大きい → バラつきが大きい,平均から遠いものが多い
  • 標準偏差が小さい → バラつきが小さい,全部が平均に近い,まとまっている

標準偏差

標準偏差の定義・使い方・分散との関係について解説します。

標準偏差の定義

標準偏差は,以下の式で定義されます。

標準偏差

標準偏差 σ\sigma はデータの散らばり具合を表す指標の一つ。データを x1,x2,,xnx_1,x_2,\cdots ,x_n とすると

σ=1ni=1n(xixˉ)2 \sigma=\sqrt{\dfrac{1}{n}\displaystyle\sum_{i=1}^n(x_i-\bar{x})^2}

ただし,xˉ\bar{x} はデータの平均。

式だけではわかりにくいので,実際のデータで計算してみましょう。

計算例

データを用いて,標準偏差を求めてみましょう。

例題

受験者5人の数学のテストの点数がそれぞれ (50,60,70,70,100)(50,60,70,70,100) であった。標準偏差を求めよ。

解答

まず平均を求める必要がある: xˉ=50+60+70+70+1005=70 \bar{x}=\dfrac{50+60+70+70+100}{5}=70

標準偏差の定義より

σ=15{(5070)2+(6070)2+(70100)2}=15(400+100+900)16.7\begin{aligned} \sigma &= \sqrt{\dfrac{1}{5}\{(50-70)^2+(60-70)^2+(70-100)^2\}}\\ &=\sqrt{\dfrac{1}{5}(400+100+900)}\\ & \fallingdotseq 16.7 \end{aligned}

標準偏差の意味:散らばりの説明

データの特徴として,以下の2つを考えることが多いです。

  1. 「だいたいどれくらいの値なのか」
  2. 「だいたいどれくらい散らばっているのか」

1については,平均値,中央値,最頻値の求め方といくつかの例 で詳しく解説しています。

標準偏差は,2に関する指標です。つまり,標準偏差はデータの散らばり具合を表す指標です。

  • 標準偏差が大きい→平均 xˉ\bar{x} から遠く離れたデータが多い→散らばり大
  • 標準偏差が小さい→平均 xˉ\bar{x} に近いデータが多い→散らばり小

例えばさきほどの例題の標準偏差は 16.716.7 でしたが,テストの点数が (65,70,70,70,75)(65,70,70,70,75) の場合は標準偏差は 25+2553.16\sqrt{\dfrac{25+25}{5}}\fallingdotseq 3.16 となり,確かに点数が散らばっている方が標準偏差が大きいです。

分散との関係

データの散らばり具合を表す指標としては分散もよく使われます。→分散の意味と二通りの計算方法

定義からわかるように,標準偏差は分散の平方根です。つまり,標準偏差の二乗=分散です。標準偏差か分散のどちらか一方からもう片方はすぐに分かります。

標準偏差のよいところ

単位の次元がデータと同じ

標準偏差は単位の次元がデータと同じなので,実データの散らばり具合を表現する際には標準偏差が用いられることがやや多いです。例えばさきほどの例題について強引に単位をつけるとすると,標準偏差は σ=16.7\sigma=16.7 (点),分散は σ2=280\sigma^2=280 (点 2{}^2 )となります。

偏差値の計算に使われる

偏差値の計算にも標準偏差が登場します。→偏差値の意味・目安・5つの性質

分散のよいところ

統計学・数学において使いやすい

確率分布の散らばり具合を表すのには分散が用いられることが多いです。分散は「平均まわりの二次モーメント」であり,数学的な主張を(標準偏差を使う場合よりも)美しく記述できることが多いです。

平均点が同じ70点でも,標準偏差が小さいときの方が100点の価値は高くなります。

Tag:数学1の教科書に載っている公式の解説一覧