指数分布の意味と具体例

指数分布(Exponential distribution)

指数分布とは,ランダムなイベントの発生間隔を表す分布です。指数分布は「地震が起きる間隔」や「電球の寿命」などを表す分布として使われます。

この記事では,指数分布の意味指数分布とポアソン分布との関係などについて解説します。

指数分布の例と重要性

指数分布とは,ランダムなイベントの発生間隔を表す分布です。「ランダムなイベント」とは大雑把に言うと「起こる確率が常に一定である」ようなイベントのことです。例えば,

  • 地震が起きる間隔
  • 電球の寿命
  • 人とすれ違うタイミングの間隔

などは(おおよそ)指数分布に従うと言えます。

指数分布の確率密度関数

(平均が μ\mu である)指数分布の確率密度関数は

f(x)=1μexμ(x0)f(x)=\dfrac{1}{\mu}e^{-\frac{x}{\mu}}\:(x \geq 0)

となります。

参考:確率密度関数の意味と具体例

例えば,寿命が「平均 10001000 時間の指数分布」に従う電球について,寿命が 500500 時間以下となってしまう確率は,

0500f(x)dx=050011000ex1000dx=1e50010000.39\displaystyle\int_0^{500}f(x)dx\\ =\displaystyle\int_0^{500}\dfrac{1}{1000}e^{-\frac{x}{1000}}dx\\ =1-e^{-\frac{500}{1000}}\\ \fallingdotseq 0.39

のように計算できます(つまり,約 3939 %であることが分かります)。

指数分布のグラフ

指数分布の確率密度関数 f(x)=1μexμ(x0)f(x)=\dfrac{1}{\mu}e^{-\frac{x}{\mu}}\:(x \geq 0) のグラフは以下のようになります。

指数分布のグラフ μ=0.2,0.5,1,2,5\mu = 0.2, 0.5, 1, 2,5 の場合を描いています。色は順番に,赤,緑,青,黄,紫です。グラフから,

  • μ\mu がどの値でも単調減少
  • μ\mu が大きいほど右に寄る(つまり平均が大きくなる)

ことがわかります。

ポアソン分布との関係

ランダムな(いつ起こるか分からない,不定期な)イベントは世の中にたくさんあります。指数分布・ポアソン分布はともに,そのようなイベントに関連した分布です。

(長い時間平均すると)時間 μ\mu あたり1回起こるような「ランダムなイベント」について,

1. イベントの発生間隔は平均 μ\mu の指数分布に従う

2. 単位時間にイベントが起きる回数は平均 1μ\dfrac{1}{\mu} のポアソン分布に従う

発生間隔が長いほど,発生回数は小さくなることに注意してください。

ランダムな現象を「発生間隔で捉えると指数分布,発生回数で捉えるとポアソン分布」と覚えておきましょう。

2についてはポアソン分布の意味と平均・分散で詳しく解説しています。1については以下で証明します。

指数分布の式の導出

では,なぜ「ランダムなイベントの発生間隔」を表す分布が,確率密度関数が

f(x)=1μexμf(x)=\dfrac{1}{\mu}e^{-\frac{x}{\mu}}

である指数分布になるのでしょうか?

少し難しいですが,これを証明してみます。

証明

Δx\Delta x が十分小さいとき,時刻 xx から x+Δxx+\Delta x の間にイベントが発生する確率を二通りの方法で求める。

・確率密度関数の定義により f(x)Δxf(x)\Delta x

・(時刻 xx までイベントが起こらない確率)×(それから Δx\Delta x の間に起こる確率)

(10xf(t)dt)×1μΔx(1-\displaystyle\int_0^xf(t)dt)\times \dfrac{1}{\mu}\Delta x

ただし「発生間隔の平均が μ\mu であるランダムなイベント」が「時間 Δx\Delta x の間に起こる確率」は 1μΔx\dfrac{1}{\mu}\Delta x であることを用いた。

よって,

f(x)=1μ1μ0xf(t)dtf(x)=\dfrac{1}{\mu}-\dfrac{1}{\mu}\displaystyle\int_0^{x}f(t)dt

両辺を xx で微分すると,

f(x)=1μf(x)f'(x)=-\dfrac{1}{\mu}f(x)

この微分方程式を解くと,f(x)=Cexμf(x)=Ce^{-\frac{x}{\mu}}

確率密度関数であるので 0f(x)dx=1\displaystyle\int_0^{\infty} f(x)dx=1 となるように定数 CC を定めると,C=1μC=\dfrac{1}{\mu} を得る。

つまり,f(x)=1μexμf(x)=\dfrac{1}{\mu}e^{-\frac{x}{\mu}}

※求める確率密度関数が滑らか(微分可能)であることは仮定しました。

幾何分布との関係

指数分布は連続型確率分布です。指数分布の離散バージョンが幾何分布です。

指数分布も幾何分布も「無記憶性」を持ちます。 →幾何分布の具体例と期待値,無記憶性について

確率密度関数であることの確認

指数分布は確率密度関数が比較的単純なので,分布のいろいろな量を求めるよい計算練習になります。そのため,各種試験(アクチュアリー,大学院入試など)に頻出,という意味でも重要です。

例えば,指数分布の確率密度関数:

f(x)=1μexμ(x0)f(x)=\dfrac{1}{\mu}e^{-\frac{x}{\mu}}\:(x \geq 0)

が確かに確率密度であることを確認します。

証明

0f(x)dx=[exμ]0=1\displaystyle\int_0^{\infty}f(x)dx=[-e^{-\frac{x}{\mu}}]_0^{\infty}=1 よりOK。

指数分布の期待値

指数分布の平均(期待値)が μ\mu であることを確認します。

証明には部分積分,および limxxex=0\displaystyle\lim_{x\to\infty}xe^{-x}=0 を用います。

指数分布の平均の証明

E[X]=0xf(x)dx=0xμexμdx=[xexμ]0+0exμdx=0+[μexμ]0=μE[X]=\displaystyle\int_0^{\infty}xf(x)dx\\ =\displaystyle\int_0^{\infty}\dfrac{x}{\mu}e^{-\frac{x}{\mu}}dx\\ =\left[-xe^{-\frac{x}{\mu}}\right]_0^{\infty}+\int_0^{\infty}e^{-\frac{x}{\mu}}dx\\ =0+\left[-\mu e^{-\frac{x}{\mu}}\right]_0^{\infty}\\ =\mu

指数分布の分散

指数分布の分散が μ2\mu^2 であることを確認します。

指数分布の分散の証明

E[X2]=0x2f(x)dx=0x2μexμdx=1μ([x2(μexμ)]0+02xμexμdx)=2μ0xμexμdx=2μμ=2μ2E[X^2]=\displaystyle\int_0^{\infty}x^2f(x)dx\\ =\displaystyle\int_0^{\infty}\dfrac{x^2}{\mu}e^{-\frac{x}{\mu}}dx\\ = \dfrac{1}{\mu}\left(\left[x^2\left(-\mu e^{-\frac{x}{\mu}}\right)\right]_0^{\infty} + \displaystyle\int_0^{\infty} 2x\mu e^{-\frac{x}{\mu}} dx\right)\\ = 2\mu \displaystyle\int_0^{\infty} \dfrac{x}{\mu} e^{-\frac{x}{\mu}} dx\\ = 2\mu \cdot \mu\\ = 2\mu^2

よって,

V[X]=E[X2]{E[X]}2=2μ2μ2=μ2V[X] = E[X^2] - \left\{E[X]\right\}^2\\ = 2\mu^2 - \mu^2\\ = \mu^2

3日間誰からもメールが来ない寂しい時期もあれば,1日に大量にメールが来る日もあるのが納得できます。

Tag:いろいろな確率分布の平均,分散,特性関数などまとめ