1. 高校数学の美しい物語
  2. イェンゼンの不等式の3通りの証明

イェンゼンの不等式の3通りの証明

更新日時 2021/03/07

イェンゼンの不等式(Jensen,凸関数の不等式)

f(x)f(x) が凸関数のとき,

任意の λi0,xi(i=1,,n),i=1nλi=1\lambda_i\geq 0,\:x_i\:(i=1,\cdots,n),\:\displaystyle\sum_{i=1}^n\lambda_i=1

に対して,

i=1nλif(xi)f(i=1nλixi){\displaystyle\sum_{i=1}^{n}\lambda_if(x_i)}\geq f({\displaystyle\sum_{i=1}^{n}\lambda_ix_i})

特に n=2,3n=2, 3 の場合が頻繁に用いられます:

n=2:λ1,λ20,λ1+λ2=1n=2:\lambda_1,\lambda_2\geq 0, \lambda_1+\lambda_2=1 のとき

λ1f(x1)+λ2f(x2)f(λ1x1+λ2x2)\lambda_1f(x_1)+\lambda_2f(x_2)\geq f(\lambda_1x_1+\lambda_2x_2)

n=3:λ1,λ2,λ30,λ1+λ2+λ3=1n=3:\lambda_1,\lambda_2, \lambda_3\geq 0,\lambda_1+\lambda_2+\lambda_3=1 のとき λ1f(x1)+λ2f(x2)+λ3f(x3)f(λ1x1+λ2x2+λ3x3)\lambda_1f(x_1)+\lambda_2f(x_2)+\lambda_3f(x_3)\geq f(\lambda_1x_1+\lambda_2x_2+\lambda_3x_3)

目次
  • イェンゼンの不等式の意味

  • イェンゼンの不等式の証明1(数学的帰納法)

  • イェンゼンの不等式の証明2(接線)

  • イェンゼンの不等式の証明3(直感)

イェンゼンの不等式の意味

まずは準備として「凸関数」について説明します。

f(x)f(x) が凸関数である」というのは f(x)f(x) が以下の3つの性質のいずれかを満たすことを言います。

性質1:任意の x1,x2,λ(0λ1)x_1, x_2, \lambda \:(0\leq \lambda\leq 1) に対して,λf(x1)+(1λ)f(x2)f(λx1+(1λ)x2)\lambda f(x_1)+(1-\lambda)f(x_2)\geq f(\lambda x_1+(1-\lambda)x_2) を満たす。

性質2:任意の x1,x2x_1, x_2 に対して,2点 (x1,f(x1)),(x2,f(x2))(x_1, f(x_1)), (x_2, f(x_2)) を結ぶ線分が関数の上側にある(図参照)。

凸関数の定義

性質3:二階微分 f(x)f^{\prime\prime}(x) が存在して0以上である。

二階微分が存在するなら以上の 3つの性質は同値で,1つ成立すれば凸関数であると言えます(二階微分が存在しないときは性質1と性質2のみが同値)。

性質1が最も基本的で,凸関数の性質を議論する際に用いられます。性質2により凸関数をイメージすることができます。性質3は実際に関数が凸関数かどうかを判断する基準として用いられます。

イェンゼンの不等式は,線分(凸包)が関数の上側にあるという性質を一般的な数式で表したものです。 n=3n=3 の場合を図に示します。

イェンゼンの不等式

青い点 \geq 赤い点という図形的性質を不等式で表すとイェンゼンの不等式になります。

イェンゼンの不等式の証明1(数学的帰納法)

有名な証明方法です。

帰納法と性質1の不等式のみを用いて証明します。

証明

n=2n=2 のイェンゼンの不等式は性質1そのものである。

n=kn=k のときイェンゼンの不等式が成立すると仮定すると,

n=k+1n=k+1 のときも以下のように示すことができる。

i=1k+1λif(xi)=i=1kλif(xi)+λk+1f(xk+1){\displaystyle\sum_{i=1}^{k+1}\lambda_if(x_i)}={\displaystyle\sum_{i=1}^{k}\lambda_if(x_i)}+\lambda_{k+1}f(x_{k+1})

=Ai=1kλiAf(xi)+λk+1f(xk+1)=A{\displaystyle\sum_{i=1}^{k}\dfrac{\lambda_i}{A}f(x_i)}+\lambda_{k+1}f(x_{k+1})\hspace{10mm}A=i=1kλiA=\displaystyle\sum_{i=1}^{k}\lambda_i とおいた)

Af(i=1kλixiA)+λk+1f(xk+1)\geq A f({\displaystyle\sum_{i=1}^{k}\dfrac{\lambda_ix_i}{A}})+\lambda_{k+1}f(x_{k+1})\hspace{10mm}i=1kλiA=1\displaystyle\sum_{i=1}^{k}\dfrac{\lambda_i}{A}=1 と帰納法の仮定)

f(i=1k+1λixi)\geq f({\displaystyle\sum_{i=1}^{k+1}\lambda_ix_i})\hspace{60mm} ( A+λk+1=1A+\lambda_{k+1}=1 と性質1)

イェンゼンの不等式の証明2(接線)

イェンゼンの不等式の証明

凸関数の接線が関数の下側にあるというのは,厳密には証明する必要がありますが,直感的に明らかなのでここでは認めてしまいます。

証明

点( i=1nλixi,f(i=1nλixi))\sum_{i=1}^n\lambda_ix_i,f(\sum_{i=1}^n\lambda_ix_i)) における f(x)f(x) の接線の方程式を y=ax+by=ax+b とおくと,f(i=1nλixi))=a(i=1nλixi)+b(1)f(\sum_{i=1}^n\lambda_ix_i))=a(\sum_{i=1}^n\lambda_ix_i)+b\cdots(1)

また,凸関数なので接線は関数の下側にあるので,

f(xi)axi+b,(i=1,2,,n)f(x_i)\geq ax_i+b, (i=1,2,\cdots,n)

この各式を λi\lambda_i 倍して i=1i=1 から nn まで加える:

i=1nλif(xi)ai=1nλixi+(i=1nλi)b=a(i=1nλixi)+b\sum_{i=1}^n\lambda_if(x_i)\geq a\sum_{i=1}^n\lambda_ix_i+(\sum_{i=1}^n\lambda_i)b\\ =a(\sum_{i=1}^n\lambda_ix_i)+b

この不等式と (1)(1) からイェンゼンの不等式が示された。

イェンゼンの不等式の証明3(直感)

イェンゼンの不等式

1.凸包(図で緑色で表した図形)が関数より上側にあること

2.青い点 (i=1nλixi,i=1nλif(xi))({\displaystyle\sum_{i=1}^{n}\lambda_ix_i}, {\displaystyle\sum_{i=1}^{n}\lambda_if(x_i)}) が凸包に含まれること

より,証明されます。1は直感的に明らかです。2も直感的に正しそうですが,それでは証明にならないので一応示しておきます。

証明

まず,(λ1x1+λ2x2λ1+λ2,λ1f(x1)+λ2f(x2)λ1+λ2)\left(\dfrac{\lambda_1x_1+\lambda_2x_2}{\lambda_1+\lambda_2}, \dfrac{\lambda_1f(x_1)+\lambda_2f(x_2)}{\lambda_1+\lambda_2}\right) は点 (x1,f(x1))(x_1,f(x_1)) と点 (x2,f(x2))(x_2,f(x_2))λ2:λ1\lambda_2:\lambda_1 に内分する点なので,凸包に含まれる。

よって,(λ1x1+λ2x2λ1+λ2(λ1+λ2)+λ3x3λ1+λ2+λ3,λ1f(x1)+λ2f(x2)λ1+λ2(λ1+λ2)+λ3f(x3)λ1+λ2+λ3)\left(\dfrac{\tfrac{\lambda_1x_1+\lambda_2x_2}{\lambda_1+\lambda_2}(\lambda_1+\lambda_2)+\lambda_3x_3}{\lambda_1+\lambda_2+\lambda_3},\dfrac{\tfrac{\lambda_1f(x_1)+\lambda_2f(x_2)}{\lambda_1+\lambda_2}(\lambda_1+\lambda_2)+\lambda_3f(x_3)}{\lambda_1+\lambda_2+\lambda_3}\right)

は点 (λ1x1+λ2x2λ1+λ2,λ1f(x1)+λ2f(x2)λ1+λ2)\left(\dfrac{\lambda_1x_1+\lambda_2x_2}{\lambda_1+\lambda_2}, \dfrac{\lambda_1f(x_1)+\lambda_2f(x_2)}{\lambda_1+\lambda_2}\right) と点 (x3,f(x3))(x_3,f(x_3))λ3:λ1+λ2\lambda_3:\lambda_1+\lambda_2 に内分する点なので,凸包に含まれる。

つまり,

(λ1x1+λ2x2+λ3x3λ1+λ2+λ3,λ1f(x1)+λ2f(x2)+λ3f(x3)λ1+λ2+λ3)\left(\dfrac{\lambda_1x_1+\lambda_2x_2+\lambda_3x_3}{\lambda_1+\lambda_2+\lambda_3}, \dfrac{\lambda_1f(x_1)+\lambda_2f(x_2)+\lambda_3f(x_3)}{\lambda_1+\lambda_2+\lambda_3}\right) も凸包に含まれる。

以下同様にして,

(i=1nλixii=1nλi,i=1nλif(xi)i=1nλi)\left(\dfrac{\sum_{i=1}^n\lambda_ix_i}{\sum_{i=1}^n\lambda_i},\dfrac{\sum_{i=1}^n\lambda_if(x_i)}{\sum_{i=1}^n\lambda_i}\right) も凸包に含まれることが分かるが,i=1nλi=1\displaystyle\sum_{i=1}^n\lambda_i=1 より題意は示された。

イェンゼンの不等式は直感的に当たり前に思えること(質点たちの荷重平均はその凸包内にある)をきちんと式で表現したものです。

Tag:数学的帰納法のパターンまとめ

Tag:数学オリンピック突破のための有名不等式まとめ

Tag:有名な定理を複数の方法で証明

人気記事
  1. 高校数学の美しい物語
  2. イェンゼンの不等式の3通りの証明