東大 生物情報学科、学部生の備忘録

東京大学の学生です。日々の気づき、学び、つまづいたことをメモにします。

MENU

MinMax Theorem の証明。レイリー商と対称行列の固有値についての考察

今回扱う定理について

今回示す問題は、固有値にまつわる有名な定理であり、 Min-Max Theorem と呼ばれている。

Min-Max Theorem:


 \displaystyle
\lambda_k = \min_{V_k} \max_{\vec{x} \in V_k,  \vec{x} \ne 0} R_A(\vec{x})  \quad  \left( \text{where }  R_A(\vec{x}) = \dfrac{(\vec{x}, A\vec{x})}{(\vec{x},\vec{x})} \right)

定理の紹介

 R_A(\boldsymbol x) はレイリー商と呼ばれている。 証明に入る前にレイリー商の性質について述べる。レイリー商は、引数が 行列  A固有ベクトルの時に、その固有ベクトルに対応する固有値を返す。 このことは簡単に確認できる。固有ベクトル  \boldsymbol{u_i} A {\boldsymbol u_i} = \lambda_i \boldsymbol{u_i} を満たすことから、
\begin{align}
    R_A(\boldsymbol{u_i})  =
    \dfrac{(\boldsymbol{u_i}, A \boldsymbol{u_i})}
    {(\boldsymbol{u_i}, \boldsymbol{u_i})}
                          = \lambda_i
    \dfrac{(\boldsymbol{u_i}, \boldsymbol{u_i})}
    {(\boldsymbol{u_i}, \boldsymbol{u_i})}
                          = \lambda_i.
\end{align}

The Proof of Min-Max Theorem

行列  A n \times n の実対称行列である。  1\leq k \leq n を定数として考える。証明の流れとしては、二つの不等式を導出し、 導出された不等式を利用して、等号を示す。また、「 \exists」と「 \forall」に 注意することが重要であり、それがこの定理の本質であると考えている。

A は実対称行列なので、対角化できる。 固有ベクトルを、対応する固有値が小さい方から大きい順に  {\displaystyle \boldsymbol{u_1}, \boldsymbol{u_2}, \dots, \boldsymbol{u_n}} とおくと、  S = \lbrace
\boldsymbol{u_1}, \boldsymbol{u_2}, \dots, \boldsymbol{u_n}
\rbrace は正規直交基底をなす。

 n 次元空間の  k 次元部分空間 V_k について、  V_k^* = \text{span}
    \lbrace
    \boldsymbol{u_1}, {\boldsymbol u_2}, \dots, {\boldsymbol u_k}
    \rbrace を考えると、  ^\forall {\boldsymbol v} \in V_k^* に対して、

 {
\begin{equation}
    \boldsymbol{v} = \alpha_1 \boldsymbol{u_1} +
    \alpha_2 \boldsymbol{u_2} + \dots +
    \alpha_k \boldsymbol{u_k}
\end{equation}
}

を満たす  \alpha_1, \alpha_2, \dots, \alpha_k が存在する。  \lambda_1 \leq \lambda_2 \leq \dots \leq \lambda_k を利用すると、 どんな  \boldsymbol{v} \in V_k^*に対しても (どんな  \alpha_1, \alpha_2, ..., \alpha_k に対しても)、レイリー商は、

\begin{equation} R_A(v) = \dfrac{\lambda_1 \alpha_1^2 + \lambda_2 \alpha_2^2 + \dots \lambda_k \alpha_k^2} {\alpha_1^2 + \alpha_2^2 + \dots + \alpha_k^2}
\leq \dfrac{\lambda_k(\alpha_1^2 + \alpha_2^2 + \dots + \alpha_k^2)} {\alpha_1^2 + \alpha_2^2 + \dots + \alpha_k^2}
= \lambda_k \end{equation}

を満たす。  R_A(\boldsymbol{v}) \leq \lambda_k は任意の  \boldsymbol{v} \in V_k^* において成り立ち、  V_k についての条件も再度まとめると、今までの議論は以下のように書き下すことができる。すなわち、

 {
\displaystyle
\begin{equation}
    \max_{\boldsymbol{v} \in V_k }R_A(\boldsymbol{v}) \leq \lambda_k
    \quad (\text{if } V_k = \text{ span}
    \lbrace
    \boldsymbol{u_1}, \boldsymbol{u_2}, \dots, \boldsymbol{u_k}
    \rbrace
    )\label{十分 1st}
\end{equation}
}

この式は次の式の十分条件である。 つまり、この式が成り立てば、以下の式も成り立つということである。

\begin{equation} \min_{V_k} \left(\max_{v \in V_k } R_A(v) \right) \leq \lambda_k \end{equation}

これが、導出しようとしていた不等式の一方になる。

続いて、もう一方についても導出する。 ここで、補題「どんな  k 次元部分空間  V_k であっても、 基底  \lbrace
    {u_k}, {u_{k+1}}, \dots, {u_n}
    \rbrace で表現できる  v \in V_k が存在する」 を証明する。背理法による。もし、ある  k 次元部分空間  V_k で、そういった  v が存在しないとすると、 基底  \lbrace
    {u_k}, {u_{k+1}}, \dots, {u_n}
    \rbrace からなる  n - k + 1 次元部分空間と  k 次元部分空間に 共通部分がないということになる。そのことから、全体の空間は少なくとも  k + (n - k + 1) = n + 1 次元より大きくなければならないが、 n <  n+1 なので、矛盾。したがって、この補題は示された。

補題を用いて議論を続ける。補題から、 どのような  k 次元部分空間  V_k においても、 ある  {v} \in V_k で、 v \in \text{span} \lbrace {u_k}, {u_{k+1}}, \dots, {u_n} \rbrace

\begin{equation} v = \alpha_k {u_k} + \alpha_{k+1} {u_{k+1}} + \dots + \alpha_n {u_n} \end{equation}

を満たす  \boldsymbol{v} が存在する。 そういった  \boldsymbol{v} を用いると、レイリー商は、

\begin{align} R_A(v) & = \dfrac{\lambda_k \alpha_k^2 + \lambda_{k+1} \alpha_{k+1}^2 + \dots + \lambda_n \alpha_n^2} {\alpha_k^2 + \alpha_{k+1}^2 + \dots + \alpha_n^2} \\ & \geq \dfrac{\lambda_k(\alpha_k^2 + \alpha_{k+1}^2 + \dots + \alpha_n^2)} {\alpha_k^2 + \alpha_{k+1}^2 + \dots + \alpha_n^2} \\ & = \lambda_k \end{align} つまり、

\begin{align} \max_{v \in (V_k \cap \text{span} \lbrace {u_k}, {u_{k+1}}, \dots, {u_n} \rbrace)} R_A(v) \geq \lambda_k. \label{max 十分} \end{align}

これは、以下を示すのに十分である。(この式が成り立つならば次の式は成り立つ。)

\begin{align} \max_{v \in V_k} R_A(v) \geq \lambda_k. \end{align}

ここで、議論の始めの方で述べたように、 上の式は任意の  k 次元部分空間  V_k について 成立するので、以下が成り立つ。すなわち、

\begin{equation} \max_{v \in V_k }R_A(v) \geq \lambda_k \Leftrightarrow \min_{V_k} \left(\max_{v \in V_k } R_A(v) \right) \geq \lambda_k \end{equation}

これが導出したかった二つ目の不等式になる。 今までの議論で得た二つの不等式( \leq \geq)から、以下が導かれる。すなわち、

\begin{align} & \min_{V_k} \left(\max_{v \in V_k } R_A(v) \right) \leq \lambda_k \text{ かつ } \min_{V_k} \left(\max_{v \in V_k } R_A(v) \right) \geq \lambda_k \\ \Leftrightarrow & \min_{V_k} \left(\max_{v \in V_k } R_A(v) \right) = \lambda_k \end{align} となり、Min-Max Theorem は示された。 以上。

終わりに

結構丁寧に論を運んだ自信がある。英語版 wikipedia よりもかなり丁寧に書いた。 Cauchy's Interlace Theorem もレイリー商の不等式評価を利用して証明することができる。 レイリー商、名前もかっこいいし、性質も Cool だし、憧れます。 (もちろん、レポートに丸写ししてはなりません、、!)