本記事では,数学検定1級で頻出のトピックについてまとめていきます。
初学者の分かりやすさを優先するため,多少正確でない表現が混在することがあります。もし致命的な間違いがあればご指摘いただけると助かります。
多変数関数の極値
多変数関数$f(x_{1},x_{2},\ldots,x_{n})$の極値は次のように判定できる。
- 偏導関数の値が全て$0$でヘッセ行列が正定値ならば極小値
- 偏導関数の値が全て$0$でヘッセ行列が負定値ならば極大値
- 偏導関数の値が全て$0$でヘッセ行列が不定値ならば鞍点
- 偏導関数の値が全て$0$でヘッセ行列が正定値または半負定値ならば極値判定不能
ただし,偏微分作用素を$\nabla=\partial/\partial x_{i}$とおくと,ヘッセ行列$H$は
H &= \nabla\otimes\nabla f =
\begin{pmatrix}
\partial^{2}f/\partial x_{1}^{2} & \partial^{2}f/\partial x_{1}\partial x_{2} & \cdots & \partial^{2}f/\partial x_{1}\partial x_{n} \\
\partial^{2}f/\partial x_{2}\partial x_{1} & \partial^{2}f/\partial x_{2}^{2} & \cdots & \partial^{2}f/\partial x_{2}\partial x_{n} \\
\vdots & \vdots & \ddots & \vdots\\
\partial^{2}f/\partial x_{n}\partial x_{1} & \partial^{2}f/\partial x_{n}\partial x_{2} & \cdots & \partial^{2}f/\partial x_{n}^{2}
\end{pmatrix}
\end{align}
と表される。
ヘッシアンはヘッセ行列の行列式を表します。
理解の仕方
$f(x)$をテイラー展開で二次の項まで近似すると,
f(\va + \vx) &= f(\va) + \nabla f(\va)\vx + \frac{1}{2}\vx^{T}H_{f}(\va)\vx + \cdots
\end{align}
となります。ただし,$H_{f}(\va)$は$f$のヘッセ行列に$\vx{=}\va$を代入した行列を表します。ヘッセ行列は対称行列であるため適当な直交行列$P$により対角化を行うことができ,対角成分に固有値$\lambda_{1},\ldots,\lambda_{n}$を並べた行列を$\Lambda$とおくと,
H_{f}(\va) &= P\Lambda P^{-1} = P\Lambda P^{T}
\end{align}
と表されます。$P^{T}\vx=\vy$とおいてテイラー展開に代入すると,
f(\va+P\vy)
&= f(\va) + \nabla f(\va)(P\vy) + \frac{1}{2}\vy^{T}P^{T}H_{f}(\va)P\vy + \cdots\\[0.7em]
&= f(\va) + \nabla f(\va)(P\vy) + \frac{1}{2}\vy^{T}\Lambda \vy + \cdots
\end{align}
となります。ここで「極値判定する際には$\nabla f(\va){=}\vzero$となる点のみを考えてテイラー展開で三次の項以降は無視する」を認めると,二次形式の項だけを最小・最大化すればよいことになります。二次形式を展開すると,
f(\va+P\vy)
&= f(\va) + \frac{1}{2}\sum_{i=1}^{n}\lambda_{i}y_{i}^{2}
\end{align}
となるため,$f(\va+P\vy)$が$f(\va)$の周辺を表すことに注意すると,
- 固有値が全て正ならば$f(\va)$の周辺は$f(\va)$よりも大きくなる。つまり$f(\va)$は極小値。
- 固有値が全て負ならば$f(\va)$の周辺は$f(\va)$よりも小さくなる。つまり$f(\va)$は極大値。
- 固有値が正負混在しているならば固有値が正の方向には極小値,負の方向には極大値となる。つまり$f(\va)$は鞍点。
- 固有値に$0$を含むならば極値判定はできない。
が分かります。行列の符号と同値な定義より固有値の表現を行列の符号に置き換えると,冒頭の判定方法が得られます。
「周辺」というのは固有ベクトルの方向に曲面を「歩く」イメージです。
具体例
次の関数の極値を求めよ。
z &= x(1-x^{2}-y^{2})
\end{align}
解答
一階導関数は
\begin{cases}
z_{x} = 1-3x^{2}-y^{2}\\[0.7em]
z_{y} = -2xy
\end{cases}
となるため,極値を取る$(x,y)$の候補は$(0,\pm 1)$および$(\pm 1/\sqrt{3},0)$となります。二階導関数は
\begin{cases}
z_{xx} = -6x\\[0.7em]
z_{xy} = z_{yx} = -2y\\[0.7em]
z_{yy} = -2x
\end{cases}
となるため,ヘッシアンは
|H| &=
\begin{vmatrix}
\partial^{2}z/\partial x^{2} & \partial^{2}z/\partial x\partial y\\
\partial^{2}z/\partial x\partial y & \partial^{2}z/\partial y^{2}
\end{vmatrix}
=
\begin{vmatrix}
-6x & -2y\\
-2y & -2x
\end{vmatrix}
\end{align}
となり,以下の表を得ます。
$(x,y)$ | $1$次首座行列式 | $2$次首座行列式 | $H$の符号 | 極値 | $z(x,y)$ |
---|---|---|---|---|---|
$(0,1)$ | $0$ | $-4$ | 半負定値 | 判定不能 | $0$ |
$(0,-1)$ | $0$ | $1$ | 半正定値 | 判定不能 | $0$ |
$(1/\sqrt{3},0)$ | $-2\sqrt{3}$ | $4$ | 負定値 | 極大値 | $2\sqrt{3}/9$ |
$(-1/\sqrt{3},0)$ | $2\sqrt{3}$ | $4$ | 正定値 | 極小値 | $-2\sqrt{3}/9$ |
したがって,$z$は$(1/\sqrt{3},0)$のとき極大値$2\sqrt{3}/9$,$(-1/\sqrt{3},0)$のとき極小値$-2\sqrt{3}/9$を取ります。
$(0,1)$と$(0,-1)$はそれぞれ極大値よりも小さく極小値よりも大きいため極値ではありません。
コメント