アクチュアリー

アクチュアリー に関する58記事をまとめました。くわしくは各リンク先を見てください。

確率密度関数の定義

連続型確率変数 XX に対して,XXaa 以上 bb 以下となる確率が,積分を用いて P(aXb)=abf(x)dxP(a\leq X\leq b)=\displaystyle\int_a^bf(x)dx で与えられるとき,f(x)f(x) を確率密度関数という。

→確率密度関数の意味と具体例

ポアソン分布とは「一定時間内にランダムなイベントが何回発生するか」を表す分布。

→ポアソン分布の意味と平均・分散

正規分布(ガウス分布)の確率密度関数は,

f(x)=12πσexp{(xμ)22σ2}f(x)=\dfrac{1}{\sqrt{2\pi}\sigma}\exp\left\{-\dfrac{(x-\mu)^2}{2\sigma^2}\right\}

です。平均は μ\mu,分散は σ2\sigma^2 です。

→正規分布の基礎的な知識まとめ

マルコフの不等式(Markov's inequality)

任意の確率変数 XXa>0a > 0 に対して(期待値 E[X]E[|X|] が存在するとき), P(Xa)E[X]aP(|X|\geq a)\leq\dfrac{E[|X|]}{a}

→マルコフの不等式とその証明

最小二乗法による直線の式

最小二乗法による直線の式は,y=Ax+By=Ax+B となる。ただし,

  • 傾き:A=Cov(X,Y)σX2A=\dfrac{\mathrm{Cov}(X,Y)}{\sigma_X^2}
  • 切片:B=μYAμXB=\mu_Y-A\mu_X

→最小二乗法(直線)の簡単な説明

  • Ω\Omega は集合
  • F\mathscr{F}Ω\Omega の部分集合族(σ\sigma -加法族)
  • PPF\mathscr{F} から実数への非負関数(確率測度)

→確率空間の定義と具体例(サイコロ,コイン)

大数の法則とは,大雑把に言うとたくさん実験すればデータの平均は真の平均に近づくという法則のことです。

→大数の法則をわかりやすく【意味・具体例・証明】

最小二乗法による直線フィッティング(単回帰分析)において

全変動=回帰変動+残差変動

→全変動,回帰変動,残差変動の意味と関係

指数分布(Exponential distribution)

指数分布とは,ランダムなイベントの発生間隔を表す分布です。指数分布は「地震が起きる間隔」や「電球の寿命」などを表す分布として使われます。

→指数分布の意味と具体例

決定係数 とは,予測式の精度(予測式によってデータをどれくらい説明できているか)を表す値です。

→決定係数の定義と相関係数との関係

分散共分散行列とは,分散(散らばり具合を表す指標)を多次元の確率変数に拡張したもの

→分散共分散行列の定義と性質

不偏標本分散の定義

平均 μ\mu,分散 σ2\sigma^2 の分布(母集団)からランダムに抽出したサンプルの値を x1,x2,,xnx_1,x_2,\cdots, x_n とする。

このとき,u2=1n1i=1n(xix)2u^2=\dfrac{1}{n-1}\displaystyle\sum_{i=1}^n(x_i-\overline{x})^2

とおくと,E[u2]=σ2E[u^2]=\sigma^2 となる。 u2u^2 を不偏標本分散と言う。

→不偏標本分散の意味とn-1で割ることの証明

正規分布の標準化

XX が「平均 μ\mu,分散 σ2\sigma^2 の正規分布」に従うとき,
Xμσ\dfrac{X-\mu}{\sigma} は「平均 00,分散 11 の正規分布」に従う。

→正規分布の標準化の意味と証明

最小二乗法の行列表現

主張1:行列 AA と列ベクトル bundefined\overrightarrow{b} が与えられたときに Axundefinedbundefined\|A\overrightarrow{x}-\overrightarrow{b}\| を最小にする xundefined\overrightarrow{x} を求める問題は非常に重要である。

主張2:AAA^{\top}A が正則のとき上記の問題の解は唯一つである:xundefined=(AA)1Abundefined\overrightarrow{x}=(A^{\top}A)^{-1}A^{\top}\overrightarrow{b}

→最小二乗法の行列表現(一変数,多変数,多項式)

マルコフ連鎖の定義

マルコフ連鎖とは,

P(Xt+1Xt,Xt1,,X1)=P(Xt+1Xt)P(X_{t+1}\mid X_t,X_{t-1},\dots,X_1)=P(X_{t+1}\mid X_t)

を満たすような確率変数の列 X1,X2,X_1,X_2,\dots のこと。

→マルコフ連鎖の基本とコルモゴロフ方程式

1. EX[X]=EY[EX[XY]]E_X[X]=E_Y[E_X[X\mid Y]]

E[X]=E[E[XY]]E[X]=E[E[X\mid Y]] と書くこともある

2. VX[X]=EY[VX[XY]]+VY[EX[XY]]V_X[X]=E_Y[V_X[X\mid Y]]+V_Y[E_X[X\mid Y]]

V[X]=E[V[XY]]+V[E[XY]]V[X]=E[V[X\mid Y]]+V[E[X\mid Y]] と書くこともある

→条件付き期待値,分散の意味と有名公式

統計学における推定

  • (専門用語で)標本集団から母集団の特徴を推定すること
  • (意訳)一部のデータの特徴から全体の特徴を予想すること

→統計学における推定の考え方(点推定,区間推定)

統計学における仮説検定

仮説検定とは,データから,ある仮説が正しいかどうかを分析する手法。

pic01

→統計学的仮説検定の考え方と手順

カイ二乗分布と正規分布の関係

確率変数 X1,X2,,XnX_1,X_2,\cdots,X_n が互いに独立に標準正規分布 N(0,1)N(0,1) に従うとき,X=X12+X22++Xn2X=X_1^2+X_2^2+\cdots +X_n^2 は自由度 nn のカイ二乗分布に従う。

→正規分布の二乗和がカイ二乗分布に従うことの証明

一様分布の確率密度関数

区間 [a,b][a,b] 上の一様分布の確率密度関数は

f(x)={1ba(axb)0(Otherwise)f(x)=\begin{cases}\dfrac{1}{b-a}&(a\leqq x\leqq b)\\0&(\mathrm{Otherwise})\end{cases}

→一様分布の平均,分散,特性関数など

(微分と積分が交換できるという正則条件のもとで)

スコア関数の期待値は 00 である:E[θlogL]=0E\left[\dfrac{\partial}{\partial\theta}\log L\right]=0

→スコア関数,フィッシャー情報量の定義と具体例

大数の法則の大雑把な意味

nn が大きいときサンプル平均 Xn\overline{X}_n は真の平均 μ\mu に近づく。

→大数の法則と中心極限定理の意味と関係

二項分布の正規近似(ド・モアブル--ラプラスの定理)

二項分布 Bin(n,p)\mathrm{Bin}(n,p)nn が十分大きいとき,平均 npnp,分散 np(1p)np(1-p) の正規分布に近づく。

→二項分布の正規近似(ラプラスの定理)

多変量正規分布の定義

同時確率密度関数が, f(xundefined)=1(2π)n2Σexp{12(xundefinedμundefined)Σ1(xundefinedμundefined)}f(\overrightarrow{x})=\dfrac{1}{(2\pi)^{\frac{n}{2}}\sqrt{|\Sigma|}}\exp \left\{-\dfrac{1}{2}(\overrightarrow{x}-\overrightarrow{\mu})^{\top}\Sigma^{-1}(\overrightarrow{x}-\overrightarrow{\mu})\right\} で表される分布を**多変量正規分布(多変量ガウス分布)**と言う。

→多変量正規分布の確率密度関数の解説

コーシー分布

確率密度関数が f(x)=1π(1+x2)f(x)=\dfrac{1}{\pi (1+x^2)} である連続型確率分布を(標準)コーシー分布と言う。

→コーシー分布とその期待値などについて

逆関数法

累積分布関数が F(x)F(x) であるような確率分布に従う乱数を生成したいときには,[0,1][0,1] 上の一様分布に従う乱数を生成してそれに F1F^{-1} をかませばよい。

→逆関数法を用いた乱数生成の証明と例

確率変数 XX が従う分布の尖度,歪度を以下のように定義する:

歪度:E[(Xμ)3]σ3\dfrac{E[(X-\mu)^3]}{\sigma^3}

尖度:E[(Xμ)4]σ43\dfrac{E[(X-\mu)^4]}{\sigma^4}-3

→歪度,尖度の定義と意味

ボックス=ミュラー法

U1,U2U_1,U_2 が独立に [0,1][0,1] 上の一様分布に従うとき,

X1=2logU1cos2πU2X_1=\sqrt{-2\log U_1}\cos 2\pi U_2

X2=2logU1sin2πU2X_2=\sqrt{-2\log U_1}\sin 2\pi U_2

は独立に標準正規分布に従う。

→ボックス=ミュラー法(正規乱数の生成)の証明

モンテカルロ法

  1. 1×11\times 1 の正方形内にランダムに点を打つ(→注)

  2. 原点(左下の頂点)から距離が 11 以下なら 11 ポイント,11 より大きいなら 00 ポイント追加

  3. 以上の操作を NN 回繰り返す,総獲得ポイントを XX とするとき,4XN\dfrac{4X}{N} が円周率の近似値になる

→モンテカルロ法と円周率の近似計算

定理

X1,X2,,XnX_1,X_2,\cdots,X_n が互いに独立に平均 μ\mu,分散 σ2\sigma^2 の正規分布に従うとき,

1σ2i=1n(XiX)2\dfrac{1}{\sigma^2}\displaystyle\sum_{i=1}^n(X_i-\overline{X})^2 は自由度 n1n-1 のカイ二乗分布に従う。

→不偏分散と自由度n-1のカイ二乗分布

正規分布の母分散の区間推定・検定
  • 母平均 μ\mu既知の場合,
    1σ2i=1n(Xiμ)2\dfrac{1}{\sigma^2}\displaystyle\sum_{i=1}^n(X_i-\mu)^2 が自由度 nn のカイ二乗分布に従うことを使う。

  • 母平均が未知の場合,
    1σ2i=1n(XiX)2\dfrac{1}{\sigma^2}\displaystyle\sum_{i=1}^n(X_i-\overline{X})^2 が自由度 n1n-1 のカイ二乗分に従うことを使う。

→母分散の意味と区間推定・検定の方法

p値とは,(帰無仮説のもとで)実現したデータ以上に極端な値を取る確率のこと。

pic01

→p値の意味と具体例

(M/M/1モデルのもと)客が到着するスピードが λ\lambda,窓口の処理スピードが μ(>λ)\mu\:(>\lambda) のとき,行列の平均待ち時間は,

ρ1ρ1μ\dfrac{\rho}{1-\rho}\cdot\dfrac{1}{\mu}

ただし,ρ=λμ\rho=\dfrac{\lambda}{\mu}

→待ち行列理論(M/M/1モデル)の定理とその証明

ベータ分布とは,確率密度関数が f(x)=Cxa1(1x)b1(0x1) f(x)=Cx^{a-1}(1-x)^{b-1}\:(0\leq x\leq 1) であるような確率分布のことです。

ただし,a,ba,b はパラメータ(正の実数)であり,CC は規格化定数です。

→ベータ分布の意味と平均・分散の導出

多項分布の定義

同時確率関数が P(n1,,nk)=n!n1!nk!p1n1pknkP(n_1,\dots,n_k)=\dfrac{n!}{n_1!\cdots n_k!}p_1^{n_1}\cdots p_k^{n_k} (各 nin_i が非負で n1++nk=nn_1+\cdots +n_k=n のときはこの値,それ以外のときは 00

で表されるような分布を多項分布と言う。

ただし,n,p1,,pkn,p_1,\dots,p_k はパラメータで,p1++pk=1p_1+\cdots +p_k=1 を満たす。

→多項分布の意味と平均,分散,共分散などの計算

確率密度関数が以下で表される多次元の確率分布をディリクレ分布と言う

f(x1,,xn1)={Cx1α11xnαn1(x1,,xn0)0(Otherwise)f(x_1,\dots,x_{n-1}) =\begin{cases}Cx_1^{\alpha_1-1}\cdots x_n^{\alpha_n-1}&(x_1,\dots, x_n\geq 0)\\0&(\mathrm{Otherwise})\end{cases}

ただし,

  • xnx_n は,x1++xn=1x_1+\cdots +x_n=1 という関係式によって,x1,,xn1x_1,\dots,x_{n-1} から定まる値。

  • α1,,αn\alpha_1,\dots,\alpha_n はパラメータで CC は正規化定数。

→ディリクレ分布の意味と正規化,平均などの計算

相関行列とは,各成分に相関係数を並べた行列のことです。

→相関行列の定義と分散共分散行列との関係

確率変数 YY が正規分布に従うとき,eYe^Y が従う分布を対数正規分布と言う。

→対数正規分布の例と平均,分散

モーメント母関数の定義

確率変数 XX に対して,tt についての関数 E[etX]E[e^{tX}] のことをモーメント母関数(または積率母関数)と呼ぶ。

→モーメント母関数(積率母関数)の意味と具体例

指数型分布族

確率(密度 or 質量)関数が,

ある関数 gi(θ)g_i(\theta)hi(x)h_i(x)

(i=0,1,,d)(i=0,1,\dots,d) を用いて

p(xθ)=g0(θ)h0(x)exp{i=1dgi(θ)hi(x)}p(x\mid \theta)=g_0(\theta)h_0(x)\exp\left\{\displaystyle\sum_{i=1}^dg_i(\theta)h_i(x)\right\}

と表せるような分布を指数型分布族(exponential family)と言う。

→指数型分布族

二つのベクトル aundefined=(a1,a2,,an)\overrightarrow{a}=(a_1,a_2,\cdots,a_n)bundefined=(b1,b2,,bn)\overrightarrow{b}=(b_1,b_2,\cdots,b_n) に対して

a1b1++anbna12++an2b12++bn2\dfrac{a_1b_1+\cdots +a_nb_n}{\sqrt{a_1^2+\cdots +a_n^2}\sqrt{b_1^2+\cdots +b_n^2}}

をコサイン類似度(またはコサイン距離)と言う。

→コサイン類似度

「向き」に確率をのせた分布の代表例としてフォンミーゼスフィッシャー分布がある。

→フォンミーゼスフィッシャー分布

ガンマ分布の意味

ガンマ分布は,期間 μ\mu ごとに1回くらい起こるランダムな事象が nn 回起こるまでの時間の分布を表す。

→ガンマ分布の意味と期待値、分散

負の二項分布の意味

確率 pp で成功するような試行を繰り返すとき,kk 回成功するまでにかかる回数が従う分布は負の二項分布。

→負の二項分布の意味と期待値、分散

確率密度関数が f(r)=rσ2er22σ2f(r)=\dfrac{r}{\sigma^2}e^{-\frac{r^2}{2\sigma^2}}r0r\geq 0)であるような連続型確率分布をレイリー分布と言う。

→レイリー分布の期待値、分散、正規分布との関係

ベイズ推定とは「過去の経験」と「新たに得たデータ」をもとに不確実な事象を予測する手法である。

→ベイズ推定の簡単な例と利点

偏相関係数の定義

XX の影響を除いた YY」と「XX の影響を除いた ZZ」の相関係数 ρYZ,X\rho_{YZ,X} は, ρYZ,X=ρYZρXYρXZ1ρXY21ρXZ2\rho_{YZ,X}=\dfrac{\rho_{YZ}-\rho_{XY}\rho_{XZ}}{\sqrt{1-\rho^2_{XY}}\sqrt{1-\rho^2_{XZ}}} で定義され,偏相関係数と呼ばれる。

→偏相関係数の意味と式の導出

超幾何分布の意味

合計 NN 個のものの中に,当たりが AA 個入っている。この NN 個から nn 個選んだときに,当たりが何個あるか?

を表す分布を超幾何分布と言う(パラメータは N,A,nN,A,n の3つ)。

超幾何分布の意味

→超幾何分布の意味と期待値の計算

00 以上 11 以下の数字をランダムに独立に nn 個生成する。このとき,小さい方から kk 番目の数の期待値は kn+1\dfrac{k}{n+1} となる。

→最大値と最小値の分布(一般論と例)

逐次最小二乗法における更新式

θundefinedn+1=θundefinedn+Pn+1aundefinedn+1(bn+1aundefinedn+1θundefinedn)Pn+1=PnPnaundefinedn+1aundefinedn+1Pn1+aundefinedn+1Pnaundefinedn+1\begin{aligned} \overrightarrow{\theta}_{n+1} &= \overrightarrow {\theta}_{n}+P_{n+1}\overrightarrow{a}_{n+1} (b_{n+1}-\overrightarrow{a}_{n+1}^{\top}\overrightarrow{\theta}_n)\\ P_{n+1}&=P_n-\dfrac{P_n\overrightarrow{a}_{n+1}\overrightarrow{a}_{n+1}^{\top}P_n}{1+\overrightarrow{a}_{n+1}^{\top}P_n\overrightarrow{a}_{n+1}} \end{aligned}

→逐次最小二乗法(RLS)

逆正弦法則1(時間の割合)

試行回数が十分大きいとき,「プラスの状態にいた時間の割合 R1R_1」が従う分布は,逆正弦分布に近づく。

ただし,この記事では以下の分布を逆正弦分布と呼ぶ。

A. 確率密度関数は p(r)=1π1r(1r)p(r)=\dfrac{1}{\pi}\dfrac{1}{\sqrt{r(1-r)}}
B. 累積分布関数は F(r)=2πArcsinrF(r)=\dfrac{2}{\pi}\mathrm{Arcsin}\sqrt{r}

→逆正弦法則の意味と導出

問題設定
  • 確率関数が π(x)\pi(x) である確率分布に従うサンプルを生成したい
  • π(x)\pi(x) は計算できないが,π(x)\pi(x) に比例する関数 π~(x)\tilde{\pi}(x) の計算はできる

→MCMCの基礎(メトロポリス・ヘイスティングス法)

定義

推移確率行列が PP であるマルコフ連鎖に対して,πundefinedP=πundefined\overrightarrow{\pi} P=\overrightarrow{\pi} を満たす確率ベクトル πundefined\overrightarrow{\pi} を定常分布と呼ぶ。

→定常分布・極限分布・詳細釣り合い条件・収束定理

ワイブル分布(基本形)

確率密度関数が f(t)=mtm1exp(tm)(t0)f(t)=mt^{m-1}\exp(-t^m)\:(t\geqq 0) である確率分布をワイブル分布と言う。

→ワイブル分布

  • 多変量正規分布に従う確率変数(ベクトル)x\vec{x} のうち,一部の変数 xB\vec{x_B} がわかったもとで,残りの変数 xA\vec{x_A} が従う条件付き分布 P(xAxB)P(\vec{x_A}\mid\vec{x_B}) は,多変量正規分布になる。

  • その多変量正規分布 P(xAxB)P(\vec{x_A}\mid\vec{x_B}) の平均 μAB\vec{\mu}_{A\mid B} と分散共分散行列 ΣAB\Sigma_{A\mid B} は簡単な行列計算で求められる。

→正規分布の条件付き分布

ガウス・マルコフの定理

最小二乗法による傾きの推定値 A^=Cov(X,Y)σX2\hat{A}=\dfrac{\mathrm{Cov}(X,Y)}{\sigma_X^2}最良線形不偏推定量である。

→最良線形不偏推定量(BLUE)とガウス・マルコフの定理

  1. アクチュアリーの資格を取る

  2. アクチュアリーを採用している企業から内定をもらう

→アクチュアリーとは&なるためには

段階1:前提知識(高校数学,線形代数,微積分)を理解

段階2:確率・統計分野の大雑把な理解(教科書を読む)

段階3:モデリングの教科書をざっと読む

段階4:過去問をとにかく解く,解けなかったところを確認する

→アクチュアリー試験数学の範囲と勉強法