1. 高校数学の美しい物語
  2. 確率密度関数の意味と具体例

確率密度関数の意味と具体例

更新日時 2021/03/07

連続型確率変数 XX に対して,XXaa 以上 bb 以下となる確率が,積分を用いて P(aXb)=abf(x)dxP(a\leq X\leq b)=\displaystyle\int_a^bf(x)dx で与えられるとき,f(x)f(x) を確率密度関数という。

連続型確率変数および確率密度関数の話です。多くの人は高校では習いませんが,数B(旧課程では数C)の教科書に載っています。理系なら知っておきたい話題。

目次
  • 連続型確率変数

  • 確率密度関数の定義と意味

  • 確率密度関数の性質(規格化について)

  • 確率密度関数の例(正規分布)

連続型確率変数

通常,高校で扱う確率変数はとびとびの値しか取りません。例えば,サイコロの出る目を XX とすると,XX がとりうる値は 11 から 66 までの 66 通りです。このような確率変数を離散型確率変数と言います。

しかし,確率変数のとりうる値が連続的なものも考えないといろいろ不便です,例えば,00 以上 11 以下の乱数を一様ランダムに出力するような装置を考えると,その出力 XX がとりうる値は連続的に分布します。

例えば,サイコロの例だと P(X=1)=16P(X=1)=\dfrac{1}{6} などと書くことで確率分布を表すことができます。しかし,連続型確率変数に対しては離散型のときと異なりX=aX=a となる確率」には(多くの場合)意味がありません。

なぜなら,連続分布の場合,特定の値にピッタリ一致する確率は 00 だからです。例えば,上の乱数の例で x=0.1x=0.1 が出力される確率は 00 です。本当にランダムなら 0.10.1 からほんの少しはズレるはずです。

確率密度関数の定義と意味

連続分布の場合,特定の値を取る確率に意味がなくても幅を持たせてaXba\leq X\leq b となる確率」を考えればこの問題は解消されます。例えば一様乱数の例では「0.10.1 となる確率は 00 だ」と言っても意味がありませんが,0.09X0.110.09\leq X\leq 0.11 となる確率は 0.020.02 だ」と言えば確率分布の性質を反映させられます。

確率密度関数

そこで,連続型確率変数の分布を表すために確率密度関数というものが使われます。 XXaa 以上 bb 以下となる確率が P(aXb)=abf(x)dxP(a\leq X\leq b)=\displaystyle\int_a^bf(x)dx で与えられるとき,f(x)f(x) を確率密度関数と言います。

さきほどの一様乱数の例では確率密度関数は f(x)=1f(x)=1 である。

P(aXb)=ab1dx=baP(a\leq X\leq b)=\displaystyle\int_a^{b}1dx=b-a となる。

確率密度関数を用いれば,連続型確率変数の様子を簡潔に表現することができるのです!

確率密度関数の性質(規格化について)

連続型確率変数 XX の取りうる値の下限値を AA ,上限値を BB とおきます(下限がないときは A=A=-\infty,上限がないときは B=B=\infty とします)。f(x)f(x) が確率密度関数のとき, ABf(x)dx=1\displaystyle\int_A^Bf(x)dx=1 が成立します。確率は全て足し合わせると1になるからです。

f(x)=xf(x)=x[0,1][0,1] 上で確率密度関数でない。なぜなら,01xdx=12\displaystyle\int_0^1xdx=\dfrac{1}{2} となってしまうからである。そこで,上記の性質を満たすために全体を二倍して f(x)=2xf(x)=2x とすれば確率密度関数となる。

このように,ある関数を確率密度関数にするために全区間で積分して 11 になるように定数倍することを「規格化」とか「正規化」とかいいます。

確率密度関数の例(正規分布)

最も有名な連続型確率分布の例として正規分布を紹介します。

以下の確率密度関数で与えられる分布を正規分布という:

f(x)=12πσexp{(xμ)22σ2}f(x)=\dfrac{1}{\sqrt{2\pi}\sigma}\exp\left\{-\dfrac{(x-\mu)^2}{2\sigma^2}\right\}

正規分布の確率密度関数

  • exp(A)\exp(A)eAe^A のことです。
  • 平均が 00 でない場合や規格化の都合で一見複雑な数式になっていますが,関数の基本形は ex2e^{-x^2} です。
  • μ\muσ\sigma はパラメータ(定数)で,実は μ\mu は平均,σ2\sigma^2 は分散を表しています。
  • グラフを見ると,確かに x=μx=\mu の近くを取る確率が高いことが分かります。
  • 正規分布に関するより詳しいことは正規分布の基礎的なことを参照して下さい。

正規分布は「正規」と言うだけあって本当にいろいろなとこに出現します。

Tag:数検1級の範囲と必要な公式まとめ

Tag:数学Bの教科書に載っている公式の解説一覧

人気記事
  1. 高校数学の美しい物語
  2. 確率密度関数の意味と具体例