本記事は数学の徹底解説シリーズに含まれます。
初学者の分かりやすさを優先するため,多少正確でない表現が混在することがあります。もし致命的な間違いがあればご指摘いただけると助かります。
行列の符号と主小行列
エルミート行列$A\in M_{n}(\mK)$と$k=1,\ldots,n$に対し,つぎが成り立つ。
- $A$が正定値$~\Leftrightarrow~$$k$次主小行列式がすべて正
- $A$が半正定値$~\Leftrightarrow~$$k$次主小行列式がすべて非負
- $A$が負定値$~\Leftrightarrow~$$k$次主小行列式に$(-1)^{k}$を掛けたものがすべて正
- $A$が半負定値$~\Leftrightarrow~$$k$次主小行列式に$(-1)^{k}$を掛けたものがすべて非負
ただし,$\mK$は複素数空間$\mC$または実数空間$\mR$を表し,$M_{n}(\mK)$は$\mK$上の$n$次エルミート行列全体の集合を表す。
上のいずれのケースでもない場合,行列の符号の定義より$A$は不定値になります。
証明
まず以下について証明を行い,その後同じ流れで他の命題の証明を行います。
正定値⇔主小行列式がすべて正
最初に必要性,すなわち「正定値⇒主小行列式がすべて正」を証明します。次に十分性,すなわち「主小行列式がすべて正⇒正定値」を証明します。
必要性
$A$の$k$次主小行列を$A_{k}$とし,$A_{k}$が$k$次首座小行列となるように$A$の行と列を入れ替えた行列を$\hat{A}$とおきます。行列の符号と行と列の入れ替えの性質より,$A$が正定値ならば$\hat{A}$も正定値になります。したがって,$n$次元内積空間の任意の元$\vx$に対し,
\overline{\vx}^{T}\hat{A}\vx &> 0
\end{align}
が成り立ちます。すると,$\vx$として
\vx &= [x_{1},\ldots,x_{k},0,\ldots,0]
\end{align}
を選ぶと,$k$次元内積空間の任意の元$\vx_{k}=[x_{1},\ldots,x_{k}]$に対して
\overline{\vx}^{T}_{k}A_{k}\vx_{k} &> 0\label{正定値}
\end{align}
が成り立ちます。したがって,$A_{k}$は正定値になります。行列の符号と固有値の性質より,正定値行列$A_{k}$の固有値はすべて正になります。さらに,行列式は固有値の積で表されることから,$A_{k}$の行列式は正となります。すなわち,任意の$k$に対して主小行列式$A_{k}$が正となることが示されました。
十分性
すべての主小行列式が正となるとき,当然任意の$k$に対して首座小行列$A_{k}$の行列式が正となります。よって我々は,任意の$k=1,\ldots,n$に対して
\det(A_{k}) &> 0\label{行列式が正}
\end{align}
が成り立つときに,$A$が正定値となることを示せばよいです。ここでは,$n$に関する帰納法により証明します。
首座小行列の仮定のみで十分であることは天下り的ですが,差し当たり飲み込んでください。
$n=1$とし,$k=1$に対して仮定($\ref{行列式が正}$)が成り立つと仮定すると,$A$の行列式が正になります。行列式はすべての固有値の積であることから,$A$の固有値は正であることが分かります。行列の符号と固有値の性質より,すべての固有値が正であるエルミート行列$A$は正定値であることから,$A$が正定値であることが示されました。
続いて,$n\geq 2$とし,$k=1,\ldots,n-1$に対して仮定($\ref{行列式が正}$)が成り立つと仮定します。ここからの証明方法には,エルミート形式とエルミート変換の性質に基づく方法と,シルヴェスターの慣性法則に基づく方法があります。
エルミート形式とエルミート変換の性質に基づく方法
汎用性の高い議論を行うため,行列の世界から線型変換の世界に移ります。$g$を$n$次元内積空間$V$上のエルミート形式としても一般性を失いませんので,そのように設定します。$A$を$V$の一つの基底$\beta=\{v_{1},\ldots,v_{n}\}$に関する$g$の表現行列とし,$f$を$g$の極形式とします。
$k=1,\ldots,n-1$に対して仮定($\ref{行列式が正}$)が成り立つことを線型変換の言葉で表すと,$V_{n-1}=\langle v_{1},\ldots,v_{k}\rangle$上では$g$は正定値であることになります。すると,我々の目標は,$0$でない$V_{n}$の任意の元$v$に対して,$g(v)>0$を示すことです。まず,極形式の定義より,$g(v)=f(v,v)$が成り立ちます。また,行列式が0でない行列によって定まる線型変換は正則であることから,仮定($\ref{行列式が正}$)により$f$に一対一対応するエルミート変換$F$は正則になります。正則の定義より,$V$の元に線型変換$F$を施すことで$V$の任意の元を表すことができますので,$V_{n-1}$の直交補空間$V_{n-1}^{\perp}$の基底を$w$とおくと,
F(v^{\ast}) &= w
\end{align}
を満たす$V$の元$v^{\ast}$が存在します。$w$が$V_{n-1}^{\perp}$の元であることに注意すると,共役双一次形式と線型変換より,すべての$u\in V_{n-1}$に対して
f(u,v^{\ast}) = (u\mid F(v^{\ast})) = (u\mid w) = 0\label{直交}
\end{align}
が成り立ちます。エルミート双一次形式$f$は内積空間$V$における内積のことを指しますので,すべての$u\in V_{n-1}$に直交する$v^{\ast}$は$V_{n-1}$の元には含まれません。したがって,基底の定義より$\beta=\{v_{1},\ldots,v_{n-1},v^{\ast}\}$は$V$の基底になります。このとき,$a\in \mK$に対して任意の$V$の元は一意的に
v &= u + av^{\ast}\label{一意}
\end{align}
と表されます。このとき,$f$の共役双一次形式としての性質と式($\ref{直交}$)より,
g(v) &= f(v,v) = f(u + av^{\ast},u + av^{\ast}) \\[0.7em]
&= f(u, u) + 2f(u, av^{\ast}) + f(av^{\ast},av^{\ast})\\[0.7em]
&= f(u, u) + 2\oa f(u, v^{\ast}) + \oa\cdot af(v^{\ast},v^{\ast})\\[0.7em]
&= f(u,u) + |a|^{2}f(v^{\ast},v^{\ast}) = f(u,u)+c|a|^{2}
\end{align}
が成り立ちます。ただし,$f(v^{\ast},v^{\ast})=c$とおきました。我々が知りたいのは$v\neq 0$のときですので,式($\ref{一意}$)より$u\neq 0$または$a\neq 0$のときを考えますが,いずれの場合においても$c>0$を示せば十分です。したがって,以下では$c>0$を示します。式($\ref{直交}$)と表現行列の定義より,$g$の$\beta^{\prime}$に関する表現行列$A^{\prime}$は
A^{\prime} &=
\begin{bmatrix}
A_{n-1}&\vzero\\
\vzero^{T}&c
\end{bmatrix}\label{A_prime}
\end{align}
となります。区分けされた三角行列の行列式の性質より,
\det(A^{\prime}) &= c\cdot\det(A_{n-1})\label{積}
\end{align}
となります。一方,$\beta$から$\beta^{\prime}$への基底変換行列を$P$とおくと,定義より$P^{\ast}$は$\beta^{\prime}$から$\beta$への基底変換行列になりますので,基底変換行列の基底の取り換えにより
A^{\prime} = P^{\ast}AP = \oP^{T}AP
\end{align}
が成り立ちます。両辺の行列式を考えると,
\det(A^{\prime}) = \det(\oP^{T})\det(A)\det(P) = \overline{\det(P)}\det(A)\det(P) = |\det(P)|^{2}\cdot \det(A)
\end{align}
となります。ただし,積の行列式,転置行列の行列式,複素共役の行列式の性質を利用しました。仮定($\ref{行列式が正}$)より$\det(A)>0$となることと,基底変換行列の定義より$P$は正則であり,正則の性質より$\det(P)>0$となることから,$\det(A^{\prime})>0$となります。したがって,仮定($\ref{行列式が正}$)と式($\ref{積}$)より$c>0$が示されました。以上より,任意の$n$に対して主小行列$A_{k}$の行列式が正となるとき$g$が正定値であること,すなわち$A$が正定値であることを示せました。
シルヴェスターの慣性法則に基づく方法
$n$次エルミート行列は,以下のように区分けできます。
A &=
\begin{bmatrix}
A_{n-1}&\vb\\
\overline{\vb}^{T}&d
\end{bmatrix}
\end{align}
ただし,$\vb\in\mK^{n-1}$,$d\in\mK$とします。ここで,やや天下り的ですが,
P &=
\begin{bmatrix}
I_{n-1}&A_{n-1}^{-1}\vb\\
\vzero^{T}&1
\end{bmatrix}
\end{align}
で定義される行列$P$を考えます。この$P$を用いることで,$A$は
A &= P^{\ast}BP\label{A}
\end{align}
のように表されます。ただし,$P^{\ast}$は$P$の共役転置を表し,
B &=
\begin{bmatrix}
A_{n-1}&\vzero_{n-1}\\
\vzero^{T}_{n-1}&d-\ovb^{T}A_{n-1}^{-1}\vb
\end{bmatrix}
\end{align}
とおきました。式($\ref{A}$)とシルヴェスターの慣性法則より,$B$が正定値であることを示せば,$B$に正則線型変換を施した$A$も正定値になります。そこで,以下では$B$が正定値であることを示しましょう。式($\ref{A}$)の両辺の行列式をとると,
\det(A) &= \det(P^{\ast})\det(B)\det(P) = \det(\oP^{T})\det(B) = \overline{\det(P)}\det(B) = \det(B) \\[0.7em]
&= \det(A_{n-1})\cdot \det(d-\ovb^{T}A_{n-1}^{-1}\vb) \equiv \det(A_{n-1})\cdot \det(c)\label{恒等式}
\end{align}
となります。ただし,複素共役の行列式の性質を利用し,$c{=}d-\ovb^{T}A_{n-1}^{-1}\vb$とおきました。いま,仮定より$\det(A){>}0$かつ$\det(A_{n-1}){>}0$ですので,式($\ref{恒等式}$)を成り立たせるためには$c>0$となることが分かります。すると,$\vx=[\vx_{n-1}^{T},x_{n}]^{T}$のように$\vx_{n-1}\in\mR^{n-1}$と$x_{n}\in\mR$に区分けした縦ベクトル$\vx$に対し,$B$を表現表現行列にもつエルミート形式は,
\ovx^{T} B\vx =
[\ovx_{n-1}^{T}~\ox_{n}]
\begin{bmatrix}
A_{n-1}&\vzero_{n-1}\\
\vzero^{T}_{n-1}&c
\end{bmatrix}
[\vx_{n-1}^{T}~x_{n}]^{T}
= \ovx_{n-1}^{T}A_{n-1}\vx_{n-1}+c|x_{n}|^{2}\label{結論}
\end{align}
となります。仮定より$A_{n-1}$が正定値であることと$c>0$より,$\ovx^{T} B\vx>0$が示されました。すなわち,$B$が正定値であることが示されました。
以上の二つの証明方法により,任意の$n$に対して$A$が正定値であることを示せました。したがって,以下の命題の証明が完了しました。
半正定値⇔主小行列式がすべて非負
「正定値⇔主小行列式がすべて正」の議論で,$<$を$\leq$に,$>$を$\geq$に置き換えれば示すことができます。
負定値⇔主小行列式に$(-1)^{k}$を掛けたものがすべて正
$-A$が正定値であるとき$A$は負定値になりますので,「正定値⇔主小行列式がすべて正」の議論で,$A$を$-A$におきかえればよいです。実際に,シルヴェスターの慣性法則に基づく方法を用いることにすると,式($\ref{A}$)は
-A &= P^{\ast}BP\label{-A}
\end{align}
と表され,式($\ref{恒等式}$)は
\det(-A) = \det(-A_{n-1})\cdot (d+\vb^{t}A_{n-1}^{-1}\vb) \equiv \det(-A_{n-1})\cdot c\label{恒等式2}
\end{align}
となります。仮定より,$\det(-A){>}0$かつ$\det(-A_{n-1}){>}0$ですので,式($\ref{恒等式2}$)を成り立たせるためには$c{>}0$となることが分かります。すると,式($\ref{結論}$)は
\ovx^{T} B\vx =
[\ovx_{n-1}^{T}~\ox_{n}]
\begin{bmatrix}
-A_{n-1}&\vzero_{n-1}\\
\vzero^{T}_{n-1}&c
\end{bmatrix}
[\vx_{n-1}^{T}~x_{n}]^{T}
= \ovx_{n-1}^{T}(-A_{n-1})\vx_{n-1}+c|x_{n}|^{2}
\end{align}
となります。仮定より$-A_{n-1}$が正定値であることと$c>0$より,$\ovx^{T} B\vx>0$が示されました。すなわち,$B$が正定値であることが示されました。これで必要性を証明できました。逆に,十分性の議論で$A$を$-A$におきかえると,式($\ref{正定値}$)は
\ovx^{T}_{k}(-A_{k})\vx_{k} &> 0
\end{align}
のように書き換えられますので,$-A_{k}$が正定値であることが示せます。したがって,まったく同様の議論により
\det(-A_{k}) = (-1)^{k}\det(A_{k}) > 0
\end{align}
が示されます。これで十分性を証明できました。
半負定値⇔主小行列式に$(-1)^{k}$を掛けたものがすべて非負
「負定値⇔主小行列式に-1のk乗を掛けたものがすべて正」の議論で,$<$を$\leq$に,$>$を$\geq$に置き換えれば示すことができます。
以上より,すべての命題の証明が完了しました。
コメント