argmax,argminの意味と例

数学記号 arg max\mathop{\rm arg~max} および arg min\mathop{\rm arg~min} について解説します。max\max(最大値) arg max\mathop{\rm arg~max}(最大値を与える入力の集合) は混同しやすいのできちんと理解しましょう。 argmaxの意味

max の意味と例

f(x)f(x) の最大値のことを maxf(x)\max f(x) と書くことがあります。

1x21-x^2 の最大値は 11 なので,max(1x2)=1\max (1-x^2)=1

max\max の下側に動く変数や範囲を明示することも多いです。

さきほどの例をもう少しきちんと書くと,maxxR(1x2)=1\displaystyle\max_{x\in\mathbb{R}}(1-x^2)=1

ただし,R\mathbb{R} は実数全体の集合を表す。

argmax の意味と例

最大値を達成する値の集合を arg maxf(x)\mathop{\rm arg~max} f(x) と書くことがあります。

1x21-x^2 の最大値 11 を達成するのは x=0x=0 のときなので,arg max(1x2)={0}\mathop{\rm arg~max}(1-x^2)=\{0\}

  • arg max\mathop{\rm arg~max} は argument of the maximum(最大値を与える引数)の略です。
  • arg max\mathop{\rm arg~max} で一つの記号です。
  • arg max\mathop{\rm arg~max} は集合です。この例だ 00 という数ではなく「00 という1つの要素からなる集合」です。
ここまでのまとめ
  • max\max は最大値,arg max\mathop{\rm arg~max} は最大値を与える値の集合
  • max\max は値,arg max\mathop{\rm arg~max} は集合

min と argmin

min\minarg min\mathop{\rm arg~min} も同様です。

min と argmin の意味
  • min\min は最小値,arg min\mathop{\rm arg~min} は最小値を与える値の集合
  • min\min は値,arg min\mathop{\rm arg~min} は集合

argmax・argmin のいろいろな例

argmaxの例
  • xx00 または 11 のとき 3x3x の最大値は 33 です: maxx{0,1}3x=3\displaystyle\max_{x\in \{0,1\}} 3x=3 最大値を達成する xx11 です: arg maxx{0,1}3x={1}\mathop{\rm arg~max}\limits_{x\in\{0,1\}} 3x=\{1\}

  • xx00 以上 6π6\pi 以下を動くとき,sinx\sin x の最大値は 11 です: max0x6πsinx=1\displaystyle\max_{0\leq x\leq 6\pi} \sin x=1 最大値を達成する xx は3つあります: arg max0x6πsinx={π2,52π,92π}\mathop{\rm arg~max}\limits_{0\leq x\leq 6\pi} \sin x=\left\{\dfrac{\pi}{2},\dfrac{5}{2}\pi,\dfrac{9}{2}\pi\right\}

argminの例
  • xx が正の整数全体を動くとき,1x\dfrac{1}{x} の最小値は存在しません。「最小化する元の集合は空集合」と考えます: arg minxN1x=\mathop{\rm arg~min}\limits_{x\in\mathbb{N}}\dfrac{1}{x}=\emptyset

凸関数のargminは凸集合

おまけです。arg max\mathop{\rm arg~max} および arg min\mathop{\rm arg~min}に関する定理を紹介します。

定理

下に凸な関数の arg min\mathop{\rm arg~min} は凸集合(上に凸な関数の arg max\mathop{\rm arg~max} も凸集合)

多変数関数でも同様なので,一変数関数の場合のみ証明します。

証明

f(x)f(x) の定義域を SS とする。 p,qarg minxSf(x)p,q\in \mathop{\rm arg~min}\limits_{x\in S} f(x) とする。

f(x)f(x) は凸関数なので,任意の 0λ10\leq \lambda \leq 1 なる λ\lambda に対して λp+(1λ)qS\lambda p+(1-\lambda)q\in S であり, λf(p)+(1λ)f(q)f(λp+(1λ)q)()\lambda f(p)+(1-\lambda)f(q)\geq f(\lambda p+(1-\lambda)q)\:\:\cdots(*)

一方,p,qarg minxSf(x)p,q\in \mathop{\rm arg~min}\limits_{x\in S} f(x) より, λf(p)λf(λp+(1λ)q)\lambda f(p)\leq \lambda f(\lambda p+(1-\lambda)q) (1λ)f(q)(1λ)f(λp+(1λ)q)(1-\lambda)f(q)\leq (1-\lambda)f(\lambda p+(1-\lambda)q)

であり,この二つの不等式を加えると ()(*) の逆向きの不等式を得る。つまり,二つの不等式は等号で成立する。

よって,f(p)=f(λp+(1λ)q)f(p)=f(\lambda p+(1-\lambda)q) となり λp+(1λ)qarg minxSf(x)\lambda p+(1-\lambda)q\in \mathop{\rm arg~min}\limits_{x\in S} f(x) を得る。つまり,arg minxSf(x)\mathop{\rm arg~min}\limits_{x\in S} f(x) は凸集合。

argumentとaugmentって紛らわしいですよね。