argmax,argminの意味と例

更新日時 2022/01/17

argmax、argmin について解説します。max と argmax は混同しやすいのできちんと理解しましょう。

目次
  • max の意味と例

  • argmax の意味と例

  • min と argmin

  • argmax・argmin のいろいろな例

  • 凸関数のargminは凸集合

max の意味と例

f(x)f(x) の最大値のことを maxf(x)\max f(x) と書くことがあります。

1x21-x^2 の最大値は 11 なので,max(1x2)=1\max (1-x^2)=1

maxの下側に動く変数や範囲を明示することも多いです。

さきほどの例をもう少しきちんと書くと,maxxR(1x2)=0\displaystyle\max_{x\in\mathbb{R}}(1-x^2)=0

ただし,R\mathbb{R} は実数全体の集合を表す。

argmax の意味と例

最大値を達成する値の集合を arg maxf(x)\mathop{\rm arg~max} f(x) と書くことがあります。

1x21-x^2 の最大値 11 を達成するのは x=0x=0 のときなので,arg max(x2)={0}\mathop{\rm arg~max}(-x^2)=\{0\}

  • argmax は argument of the maximum(最大値を与える引数)の略です。
  • arg max\mathop{\rm arg~max} で一つの記号です。
  • argmax は集合です。この例だと 00 という数ではなく 00 という1つの要素からなる集合です。
ここまでのまとめ
  • max は最大値,argmax は最大値を与える値の集合
  • max は値,argmax は集合

min と argmin

min と argmin も同様です。

min と argmin の意味
  • min は最小値,argmin は最小値を与える値の集合
  • min は値,argmin は集合

argmax・argmin のいろいろな例

argmaxの例
  • xx00 または 11 のとき 3x3x の最大値は 33 です:
    maxx{0,1}3x=3\displaystyle\max_{x\in \{0,1\}} 3x=3
    最大値を達成する xx11 です:
    arg maxx{0,1}3x={1}\mathop{\rm arg~max}\limits_{x\in\{0,1\}} 3x=\{1\}

  • xx00 以上 6π6\pi 以下を動くとき,sinx\sin x の最大値は 11 です:
    max0x6πsinx=1\displaystyle\max_{0\leq x\leq 6\pi} \sin x=1
    最大値を達成する xx は3つあります:
    arg max0x6πsinx={π2,52π,92π}\mathop{\rm arg~max}\limits_{0\leq x\leq 6\pi} \sin x=\left\{\dfrac{\pi}{2},\dfrac{5}{2}\pi,\dfrac{9}{2}\pi\right\}

argminの例
  • xx が正の整数全体を動くとき,1x\dfrac{1}{x} の最小値は存在しません。「最小化する元の集合は空集合」と考えます:
    arg minxN1x=\mathop{\rm arg~min}\limits_{x\in\mathbb{N}}\dfrac{1}{x}=\emptyset

凸関数のargminは凸集合

おまけです。argmax・argminに関する定理を紹介します。

定理

下に凸な関数のargminは凸集合(上に凸な関数のargmaxも凸集合)

多変数関数でも同様なので,一変数関数の場合のみ証明します。

証明

f(x)f(x) の定義域を SS とする。

p,qarg minxSf(x)p,q\in \mathop{\rm arg~min}\limits_{x\in S} f(x) とする。

f(x)f(x) は凸関数なので,任意の 0λ10\leq \lambda \leq 1 なる λ\lambda に対して

λp+(1λ)qS\lambda p+(1-\lambda)q\in S であり,

λf(p)+(1λ)f(q)f(λp+(1λ)q)\lambda f(p)+(1-\lambda)f(q)\geq f(\lambda p+(1-\lambda)q) (*)を満たす。

一方,p,qarg minxSf(x)p,q\in \mathop{\rm arg~min}\limits_{x\in S} f(x) より,

λf(p)λf(λp+(1λ)q)\lambda f(p)\leq \lambda f(\lambda p+(1-\lambda)q)

(1λ)f(q)(1λ)f(λp+(1λ)q)(1-\lambda)f(q)\leq (1-\lambda)f(\lambda p+(1-\lambda)q)

であり,この二つの不等式を加えると(*)の逆向きの不等式を得る。つまり,二つの不等式は等号で成立する。

よって,

f(p)=f(λp+(1λ)q)f(p)=f(\lambda p+(1-\lambda)q)

となり

λp+(1λ)qarg minxSf(x)\lambda p+(1-\lambda)q\in \mathop{\rm arg~min}\limits_{x\in S} f(x)

を得る。よって

arg minxSf(x)\mathop{\rm arg~min}\limits_{x\in S} f(x)

は凸集合。

argumentとaugmentって紛らわしいですよね。