証明集 第15章: 特殊行列の微分

Proofs Chapter 15: Derivatives of Special Matrices

本章では特殊行列(対称行列、正定値行列、直交行列など)に関する微分公式を証明する。 対称行列制約下での最適化は共分散構造モデリング(SEM)、因子分析、 半正定値計画法(SDP)で必須であり、正定値制約はガウス過程や カーネル法のハイパーパラメータ学習に直結する。 対称行列のトレース・行列式・固有値の微分を、一般行列の結果から対称性制約を課して導出する。

前提知識: 第7章(行列式の微分)第8章(逆行列の微分)第9章(固有値の微分)関連する章: 第13章(構造行列の微分)

15. 特殊行列の微分

本章の前提条件
本章の公式は、特に断りのない限り、以下の条件下で成立する:
  • すべての公式は分母レイアウト(denominator layout)に基づく
  • 対称行列 $\boldsymbol{X}$ に対する微分は、第13章の変換公式 $\boldsymbol{G} + \boldsymbol{G}^\top - \boldsymbol{G} \circ \boldsymbol{I}$ を適用
  • 正定値行列の条件が必要な場合は個別に注記

13.4 の対称行列の微分公式を具体的な関数に適用する。一般行列の結果を $\boldsymbol{G}$ とすると、対称行列の場合は $\boldsymbol{G} + \boldsymbol{G}^\top - \boldsymbol{G} \circ \boldsymbol{I}$ となる。

15.1 対称行列のトレース微分

公式:$\displaystyle\dfrac{\partial \text{tr}(\boldsymbol{A}\boldsymbol{X})}{\partial \boldsymbol{X}}\bigg|_{\boldsymbol{X}: \text{対称}} = \boldsymbol{A} + \boldsymbol{A}^\top - \boldsymbol{A} \circ \boldsymbol{I}$
条件:$\boldsymbol{X}$ は対称行列
証明

対称行列 $\boldsymbol{X}$ に対するトレース関数 $f = \text{tr}(\boldsymbol{A}\boldsymbol{X})$ の微分を求める。

まず、一般行列の場合のトレース微分公式を確認する。7.1 より、$\boldsymbol{X}$ が一般行列のとき

\begin{equation}\dfrac{\partial \text{tr}(\boldsymbol{A}\boldsymbol{X})}{\partial \boldsymbol{X}} = \boldsymbol{A}^\top \label{eq:15-1-1}\end{equation}

したがって、一般行列の場合の勾配行列は

\begin{equation}\boldsymbol{G} = \boldsymbol{A}^\top \label{eq:15-1-2}\end{equation}

$\boldsymbol{X}$ が対称行列のとき、13.4 の変換公式を適用する。対称行列に対する微分は

\begin{equation}\dfrac{\partial f}{\partial \boldsymbol{X}}\bigg|_{\boldsymbol{X}: \text{対称}} = \boldsymbol{G} + \boldsymbol{G}^\top - \boldsymbol{G} \circ \boldsymbol{I} \label{eq:15-1-3}\end{equation}

$\eqref{eq:15-1-2}$ を $\eqref{eq:15-1-3}$ に代入する。

\begin{equation}\dfrac{\partial \text{tr}(\boldsymbol{A}\boldsymbol{X})}{\partial \boldsymbol{X}}\bigg|_{\boldsymbol{X}: \text{対称}} = \boldsymbol{A}^\top + (\boldsymbol{A}^\top)^\top - \boldsymbol{A}^\top \circ \boldsymbol{I} \label{eq:15-1-4}\end{equation}

$(\boldsymbol{A}^\top)^\top = \boldsymbol{A}$ であるから、$\eqref{eq:15-1-4}$ は

\begin{equation}\dfrac{\partial \text{tr}(\boldsymbol{A}\boldsymbol{X})}{\partial \boldsymbol{X}}\bigg|_{\boldsymbol{X}: \text{対称}} = \boldsymbol{A}^\top + \boldsymbol{A} - \boldsymbol{A}^\top \circ \boldsymbol{I} \label{eq:15-1-5}\end{equation}

ここで、Hadamard積と単位行列の性質を確認する。$\boldsymbol{A}^\top \circ \boldsymbol{I}$ は $\boldsymbol{A}^\top$ の対角成分のみを残した対角行列である。

\begin{equation}(\boldsymbol{A}^\top \circ \boldsymbol{I})_{ij} = (A^\top)_{ij} \cdot \delta_{ij} = A_{ji} \cdot \delta_{ij} \label{eq:15-1-6}\end{equation}

$\delta_{ij} = 1$ となるのは $i = j$ のときのみであるから

\begin{equation}(\boldsymbol{A}^\top \circ \boldsymbol{I})_{ii} = A_{ii} \label{eq:15-1-7}\end{equation}

同様に $\boldsymbol{A} \circ \boldsymbol{I}$ の対角成分は

\begin{equation}(\boldsymbol{A} \circ \boldsymbol{I})_{ii} = A_{ii} \label{eq:15-1-8}\end{equation}

$\eqref{eq:15-1-7}$ と $\eqref{eq:15-1-8}$ より、対角成分は一致する。

\begin{equation}\boldsymbol{A}^\top \circ \boldsymbol{I} = \boldsymbol{A} \circ \boldsymbol{I} \label{eq:15-1-9}\end{equation}

$\eqref{eq:15-1-9}$ を $\eqref{eq:15-1-5}$ に代入すると、最終結果を得る。

\begin{equation}\dfrac{\partial \text{tr}(\boldsymbol{A}\boldsymbol{X})}{\partial \boldsymbol{X}}\bigg|_{\boldsymbol{X}: \text{対称}} = \boldsymbol{A} + \boldsymbol{A}^\top - \boldsymbol{A} \circ \boldsymbol{I} \label{eq:15-1-10}\end{equation}

補足:$\boldsymbol{A}$ が対称行列の場合、$\boldsymbol{A}^\top = \boldsymbol{A}$ であるから、$\eqref{eq:15-1-10}$ は $2\boldsymbol{A} - \boldsymbol{A} \circ \boldsymbol{I}$ となる。

15.2 対称行列の行列式微分

公式:$\displaystyle\dfrac{\partial |\boldsymbol{X}|}{\partial \boldsymbol{X}}\bigg|_{\boldsymbol{X}: \text{対称}} = |\boldsymbol{X}|\left(2\boldsymbol{X}^{-1} - \boldsymbol{X}^{-1} \circ \boldsymbol{I}\right)$
条件:$\boldsymbol{X}$ は対称正則行列
証明

対称正則行列 $\boldsymbol{X}$ に対する行列式 $f = |\boldsymbol{X}|$ の微分を求める。

まず、一般行列の場合の行列式微分公式を確認する。8.1 より、$\boldsymbol{X}$ が一般の正則行列のとき

\begin{equation}\dfrac{\partial |\boldsymbol{X}|}{\partial \boldsymbol{X}} = |\boldsymbol{X}| (\boldsymbol{X}^{-1})^\top \label{eq:15-2-1}\end{equation}

したがって、一般行列の場合の勾配行列は

\begin{equation}\boldsymbol{G} = |\boldsymbol{X}| (\boldsymbol{X}^{-1})^\top \label{eq:15-2-2}\end{equation}

$\boldsymbol{X}$ が対称行列のとき、逆行列の性質を確認する。対称行列の逆行列も対称である。

\begin{equation}\boldsymbol{X}^\top = \boldsymbol{X} \implies (\boldsymbol{X}^{-1})^\top = \boldsymbol{X}^{-1} \label{eq:15-2-3}\end{equation}

$\eqref{eq:15-2-3}$ の証明:$\boldsymbol{X} \boldsymbol{X}^{-1} = \boldsymbol{I}$ の両辺の転置を取ると

\begin{equation}(\boldsymbol{X}^{-1})^\top \boldsymbol{X}^\top = \boldsymbol{I} \label{eq:15-2-4}\end{equation}

$\boldsymbol{X}^\top = \boldsymbol{X}$ を代入すると

\begin{equation}(\boldsymbol{X}^{-1})^\top \boldsymbol{X} = \boldsymbol{I} \label{eq:15-2-5}\end{equation}

$\eqref{eq:15-2-5}$ の両辺に右から $\boldsymbol{X}^{-1}$ を掛けると

\begin{equation}(\boldsymbol{X}^{-1})^\top = \boldsymbol{X}^{-1} \label{eq:15-2-6}\end{equation}

$\eqref{eq:15-2-6}$ を $\eqref{eq:15-2-2}$ に代入すると

\begin{equation}\boldsymbol{G} = |\boldsymbol{X}| \boldsymbol{X}^{-1} \label{eq:15-2-7}\end{equation}

$\boldsymbol{X}$ が対称行列のとき、13.4 の変換公式を適用する。

\begin{equation}\dfrac{\partial |\boldsymbol{X}|}{\partial \boldsymbol{X}}\bigg|_{\boldsymbol{X}: \text{対称}} = \boldsymbol{G} + \boldsymbol{G}^\top - \boldsymbol{G} \circ \boldsymbol{I} \label{eq:15-2-8}\end{equation}

$\eqref{eq:15-2-7}$ を $\eqref{eq:15-2-8}$ に代入する。$\boldsymbol{G}^\top = (|\boldsymbol{X}| \boldsymbol{X}^{-1})^\top = |\boldsymbol{X}| (\boldsymbol{X}^{-1})^\top$ であり、$\eqref{eq:15-2-6}$ より $(\boldsymbol{X}^{-1})^\top = \boldsymbol{X}^{-1}$ であるから

\begin{equation}\boldsymbol{G}^\top = |\boldsymbol{X}| \boldsymbol{X}^{-1} = \boldsymbol{G} \label{eq:15-2-9}\end{equation}

$\eqref{eq:15-2-9}$ を $\eqref{eq:15-2-8}$ に代入する。

\begin{equation}\dfrac{\partial |\boldsymbol{X}|}{\partial \boldsymbol{X}}\bigg|_{\boldsymbol{X}: \text{対称}} = \boldsymbol{G} + \boldsymbol{G} - \boldsymbol{G} \circ \boldsymbol{I} = 2\boldsymbol{G} - \boldsymbol{G} \circ \boldsymbol{I} \label{eq:15-2-10}\end{equation}

$\eqref{eq:15-2-7}$ の $\boldsymbol{G}$ を代入すると

\begin{equation}\dfrac{\partial |\boldsymbol{X}|}{\partial \boldsymbol{X}}\bigg|_{\boldsymbol{X}: \text{対称}} = 2|\boldsymbol{X}| \boldsymbol{X}^{-1} - |\boldsymbol{X}| \boldsymbol{X}^{-1} \circ \boldsymbol{I} \label{eq:15-2-11}\end{equation}

$|\boldsymbol{X}|$ を括り出すと、最終結果を得る。

\begin{equation}\dfrac{\partial |\boldsymbol{X}|}{\partial \boldsymbol{X}}\bigg|_{\boldsymbol{X}: \text{対称}} = |\boldsymbol{X}|\left(2\boldsymbol{X}^{-1} - \boldsymbol{X}^{-1} \circ \boldsymbol{I}\right) \label{eq:15-2-12}\end{equation}

15.3 対称行列の対数行列式微分

公式:$\displaystyle\dfrac{\partial \log|\boldsymbol{X}|}{\partial \boldsymbol{X}}\bigg|_{\boldsymbol{X}: \text{対称}} = 2\boldsymbol{X}^{-1} - \boldsymbol{X}^{-1} \circ \boldsymbol{I}$
条件:$\boldsymbol{X}$ は対称正定値行列
証明

対称正定値行列 $\boldsymbol{X}$ に対する対数行列式 $f = \log|\boldsymbol{X}|$ の微分を求める。

まず、一般行列の場合の対数行列式微分公式を確認する。8.2 より、$\boldsymbol{X}$ が一般の正定値行列のとき

\begin{equation}\dfrac{\partial \log|\boldsymbol{X}|}{\partial \boldsymbol{X}} = (\boldsymbol{X}^{-1})^\top \label{eq:15-3-1}\end{equation}

したがって、一般行列の場合の勾配行列は

\begin{equation}\boldsymbol{G} = (\boldsymbol{X}^{-1})^\top \label{eq:15-3-2}\end{equation}

$\boldsymbol{X}$ が対称行列のとき、15.2 の $\eqref{eq:15-2-6}$ より

\begin{equation}(\boldsymbol{X}^{-1})^\top = \boldsymbol{X}^{-1} \label{eq:15-3-3}\end{equation}

$\eqref{eq:15-3-3}$ を $\eqref{eq:15-3-2}$ に代入すると

\begin{equation}\boldsymbol{G} = \boldsymbol{X}^{-1} \label{eq:15-3-4}\end{equation}

$\boldsymbol{X}$ が対称行列のとき、13.4 の変換公式を適用する。

\begin{equation}\dfrac{\partial \log|\boldsymbol{X}|}{\partial \boldsymbol{X}}\bigg|_{\boldsymbol{X}: \text{対称}} = \boldsymbol{G} + \boldsymbol{G}^\top - \boldsymbol{G} \circ \boldsymbol{I} \label{eq:15-3-5}\end{equation}

$\boldsymbol{G} = \boldsymbol{X}^{-1}$ は対称行列であるから、$\boldsymbol{G}^\top = \boldsymbol{G}$ である。

\begin{equation}\boldsymbol{G}^\top = \boldsymbol{X}^{-1} = \boldsymbol{G} \label{eq:15-3-6}\end{equation}

$\eqref{eq:15-3-4}$ と $\eqref{eq:15-3-6}$ を $\eqref{eq:15-3-5}$ に代入する。

\begin{equation}\dfrac{\partial \log|\boldsymbol{X}|}{\partial \boldsymbol{X}}\bigg|_{\boldsymbol{X}: \text{対称}} = \boldsymbol{X}^{-1} + \boldsymbol{X}^{-1} - \boldsymbol{X}^{-1} \circ \boldsymbol{I} \label{eq:15-3-7}\end{equation}

$\eqref{eq:15-3-7}$ を整理すると、最終結果を得る。

\begin{equation}\dfrac{\partial \log|\boldsymbol{X}|}{\partial \boldsymbol{X}}\bigg|_{\boldsymbol{X}: \text{対称}} = 2\boldsymbol{X}^{-1} - \boldsymbol{X}^{-1} \circ \boldsymbol{I} \label{eq:15-3-8}\end{equation}

補足:$\eqref{eq:15-3-8}$ は 15.2 の $\eqref{eq:15-2-12}$ を $|\boldsymbol{X}|$ で割った形である。連鎖律 $\displaystyle\dfrac{\partial \log|\boldsymbol{X}|}{\partial \boldsymbol{X}} = \displaystyle\dfrac{1}{|\boldsymbol{X}|}\displaystyle\dfrac{\partial |\boldsymbol{X}|}{\partial \boldsymbol{X}}$ からも確認できる。

15.4 対角行列のトレース微分

公式:$\displaystyle\dfrac{\partial \text{tr}(\boldsymbol{A}\boldsymbol{X})}{\partial \boldsymbol{X}}\bigg|_{\boldsymbol{X}: \text{対角}} = \boldsymbol{A} \circ \boldsymbol{I}$
条件:$\boldsymbol{X} = \text{diag}(x_0, \ldots, x_{n-1})$ は対角行列
証明

対角行列 $\boldsymbol{X} = \text{diag}(x_0, \ldots, x_{n-1})$ に対するトレース関数 $f = \text{tr}(\boldsymbol{A}\boldsymbol{X})$ の微分を求める。

まず、$\text{tr}(\boldsymbol{A}\boldsymbol{X})$ を成分で展開する。トレースの定義より、行列 $\boldsymbol{AX}$ の対角成分の和を計算する。

\begin{equation}\text{tr}(\boldsymbol{A}\boldsymbol{X}) = \displaystyle\sum_{i=0}^{n-1} (\boldsymbol{A}\boldsymbol{X})_{ii} \label{eq:15-4-1a}\end{equation}

行列積の定義より、$(\boldsymbol{AX})_{ii}$ を展開する。

\begin{equation}(\boldsymbol{A}\boldsymbol{X})_{ii} = \displaystyle\sum_{k=0}^{n-1} A_{ik} X_{ki} \label{eq:15-4-1b}\end{equation}

$\eqref{eq:15-4-1b}$ を $\eqref{eq:15-4-1a}$ に代入する。

\begin{equation}\text{tr}(\boldsymbol{A}\boldsymbol{X}) = \displaystyle\sum_{i=0}^{n-1} \displaystyle\sum_{k=0}^{n-1} A_{ik} X_{ki} \label{eq:15-4-1}\end{equation}

$\boldsymbol{X}$ が対角行列のとき、非対角成分はすべて 0 である。すなわち

\begin{equation}X_{ki} = \begin{cases} x_k & (k = i) \\ 0 & (k \neq i) \end{cases} \label{eq:15-4-2}\end{equation}

ここで $x_k = X_{kk}$ は $\boldsymbol{X}$ の第 $k$ 対角成分である。$\eqref{eq:15-4-2}$ はKroneckerのデルタ $\delta_{ki}$ を用いて $X_{ki} = x_k \delta_{ki}$ と書ける。

$\eqref{eq:15-4-2}$ を $\eqref{eq:15-4-1}$ に代入する。$k \neq i$ のとき $X_{ki} = 0$ であるから、$k = i$ の項のみが残る。

\begin{equation}\text{tr}(\boldsymbol{A}\boldsymbol{X}) = \displaystyle\sum_{i=0}^{n-1} \displaystyle\sum_{k=0}^{n-1} A_{ik} x_k \delta_{ki} = \displaystyle\sum_{i=0}^{n-1} A_{ii} x_i \label{eq:15-4-3}\end{equation}

最後の等号では、$\delta_{ki} = 1$ となるのは $k = i$ のときのみであることを用いた。

$\eqref{eq:15-4-3}$ を独立変数 $x_j$($j = 0, \ldots, n-1$)で偏微分する。

\begin{equation}\dfrac{\partial \text{tr}(\boldsymbol{A}\boldsymbol{X})}{\partial x_j} = \dfrac{\partial}{\partial x_j} \displaystyle\sum_{i=0}^{n-1} A_{ii} x_i \label{eq:15-4-4}\end{equation}

$A_{ii}$ は定数であり、$\dfrac{\partial x_i}{\partial x_j} = \delta_{ij}$ であるから

\begin{equation}\dfrac{\partial \text{tr}(\boldsymbol{A}\boldsymbol{X})}{\partial x_j} = \displaystyle\sum_{i=0}^{n-1} A_{ii} \delta_{ij} = A_{jj} \label{eq:15-4-5}\end{equation}

$\eqref{eq:15-4-5}$ を行列形式で表現する。対角行列 $\boldsymbol{X}$ に対する微分は、独立変数 $x_0, \ldots, x_{n-1}$ に対応する対角行列として表される。

\begin{equation}\dfrac{\partial \text{tr}(\boldsymbol{A}\boldsymbol{X})}{\partial \boldsymbol{X}}\bigg|_{\boldsymbol{X}: \text{対角}} = \text{diag}(A_{00}, A_{11}, \ldots, A_{n-1,n-1}) \label{eq:15-4-6}\end{equation}

右辺は $\boldsymbol{A}$ の対角成分のみを取り出した行列である。これはHadamard積を用いて表せる。

\begin{equation}\text{diag}(A_{00}, A_{11}, \ldots, A_{n-1,n-1}) = \boldsymbol{A} \circ \boldsymbol{I} \label{eq:15-4-7}\end{equation}

$\eqref{eq:15-4-7}$ を $\eqref{eq:15-4-6}$ に代入すると、最終結果を得る。

\begin{equation}\dfrac{\partial \text{tr}(\boldsymbol{A}\boldsymbol{X})}{\partial \boldsymbol{X}}\bigg|_{\boldsymbol{X}: \text{対角}} = \boldsymbol{A} \circ \boldsymbol{I} \label{eq:15-4-8}\end{equation}

補足:$\boldsymbol{A} \circ \boldsymbol{I}$ はHadamard積(要素ごとの積)で、$\boldsymbol{A}$ の対角成分のみを残す操作である。成分で書くと $(\boldsymbol{A} \circ \boldsymbol{I})_{ij} = A_{ij} \delta_{ij}$ となる。

15.5 Toeplitz行列のトレース微分

公式:$\displaystyle\dfrac{\partial \text{tr}(\boldsymbol{A}\boldsymbol{T})}{\partial \boldsymbol{T}}\bigg|_{\boldsymbol{T}: \text{Toeplitz}} = \boldsymbol{\alpha}(\boldsymbol{A})$
ここで $\alpha(\boldsymbol{A})_{ij} = \displaystyle\sum_{k-l=i-j} A_{lk}$($\boldsymbol{A}^\top$ の対角線要素和)
条件:$\boldsymbol{T}$ はToeplitz行列($T_{ij} = t_{i-j}$)
証明

Toeplitz行列 $\boldsymbol{T}$ に対するトレース関数 $f = \text{tr}(\boldsymbol{A}\boldsymbol{T})$ の微分を求める。

Toeplitz行列とは、各対角線上の要素がすべて等しい行列である。すなわち

\begin{equation}T_{ij} = t_{i-j} \label{eq:15-5-1}\end{equation}

ここで $t_k$($k = -(n-1), \ldots, -1, 0, 1, \ldots, n-1$)は独立なパラメータである。例えば $n = 3$ の場合

\begin{equation}\boldsymbol{T} = \begin{pmatrix} t_0 & t_{-1} & t_{-2} \\ t_1 & t_0 & t_{-1} \\ t_2 & t_1 & t_0 \end{pmatrix} \label{eq:15-5-2}\end{equation}

$\text{tr}(\boldsymbol{A}\boldsymbol{T})$ を成分で展開する。トレースの定義より

\begin{equation}\text{tr}(\boldsymbol{A}\boldsymbol{T}) = \displaystyle\sum_{i=0}^{n-1} (\boldsymbol{A}\boldsymbol{T})_{ii} \label{eq:15-5-3a}\end{equation}

行列積の定義より、$(\boldsymbol{AT})_{ii}$ を展開する。

\begin{equation}(\boldsymbol{A}\boldsymbol{T})_{ii} = \displaystyle\sum_{j=0}^{n-1} A_{ij} T_{ji} \label{eq:15-5-3b}\end{equation}

$\eqref{eq:15-5-3b}$ を $\eqref{eq:15-5-3a}$ に代入する。

\begin{equation}\text{tr}(\boldsymbol{A}\boldsymbol{T}) = \displaystyle\sum_{i=0}^{n-1} \displaystyle\sum_{j=0}^{n-1} A_{ij} T_{ji} \label{eq:15-5-3}\end{equation}

$\eqref{eq:15-5-1}$ より、Toeplitz行列の $(j, i)$ 成分は $T_{ji} = t_{j-i}$ である。これを $\eqref{eq:15-5-3}$ に代入する。

\begin{equation}\text{tr}(\boldsymbol{A}\boldsymbol{T}) = \displaystyle\sum_{i=0}^{n-1} \displaystyle\sum_{j=0}^{n-1} A_{ij} t_{j-i} \label{eq:15-5-4}\end{equation}

$\eqref{eq:15-5-4}$ を独立変数 $t_k$ で偏微分する。$t_k$ に寄与する項は $j - i = k$ を満たすものである。

\begin{equation}\dfrac{\partial \text{tr}(\boldsymbol{A}\boldsymbol{T})}{\partial t_k} = \displaystyle\sum_{\substack{i, j \\ j - i = k}} A_{ij} \label{eq:15-5-5}\end{equation}

$\eqref{eq:15-5-5}$ の右辺を解釈する。$j - i = k$ を満たす成分 $A_{ij}$ を足し合わせている。これは行列 $\boldsymbol{A}$ の第 $k$ 対角線の要素和である。

行列 $\boldsymbol{A}$ の対角線を明示的に書く。$k = 0$(主対角線)の場合

\begin{equation}\dfrac{\partial \text{tr}(\boldsymbol{A}\boldsymbol{T})}{\partial t_0} = \displaystyle\sum_{i=0}^{n-1} A_{ii} \label{eq:15-5-6}\end{equation}

$k > 0$(上三角側の対角線)の場合

\begin{equation}\dfrac{\partial \text{tr}(\boldsymbol{A}\boldsymbol{T})}{\partial t_k} = \displaystyle\sum_{i=0}^{n-k-1} A_{i, i+k} \label{eq:15-5-7}\end{equation}

$k < 0$(下三角側の対角線)の場合

\begin{equation}\dfrac{\partial \text{tr}(\boldsymbol{A}\boldsymbol{T})}{\partial t_k} = \displaystyle\sum_{j=0}^{n+k-1} A_{j-k, j} \label{eq:15-5-8}\end{equation}

結果を行列 $\boldsymbol{\alpha}(\boldsymbol{A})$ として表現する。$\boldsymbol{\alpha}(\boldsymbol{A})$ はToeplitz構造を持つ行列で、その $(i, j)$ 成分は

\begin{equation}\alpha(\boldsymbol{A})_{ij} = \displaystyle\sum_{k-l=i-j} A_{lk} = \dfrac{\partial \text{tr}(\boldsymbol{A}\boldsymbol{T})}{\partial t_{i-j}} \label{eq:15-5-9}\end{equation}

これは $\boldsymbol{A}^\top$ の第 $(i-j)$ 対角線の要素和である。

したがって、最終結果を得る。

\begin{equation}\dfrac{\partial \text{tr}(\boldsymbol{A}\boldsymbol{T})}{\partial \boldsymbol{T}}\bigg|_{\boldsymbol{T}: \text{Toeplitz}} = \boldsymbol{\alpha}(\boldsymbol{A}) \label{eq:15-5-10}\end{equation}

補足:$\boldsymbol{\alpha}(\boldsymbol{A})$ 自身もToeplitz構造を持つ。対称Toeplitz行列の場合は 13.4 と同様に $\boldsymbol{\alpha}(\boldsymbol{A}) + \boldsymbol{\alpha}(\boldsymbol{A})^\top - \boldsymbol{\alpha}(\boldsymbol{A}) \circ \boldsymbol{I}$ となる。
出典:Toeplitz行列は O. Toeplitz (1911) "Zur Theorie der quadratischen und bilinearen Formen von unendlichvielen Veränderlichen", Mathematische Annalen 70, 351-376 に由来。

15.6 条件数の微分

公式:$\displaystyle\dfrac{\partial c(\boldsymbol{A})}{\partial \boldsymbol{A}} = \displaystyle\dfrac{1}{\lambda_{\min}}\boldsymbol{v}_{\max}\boldsymbol{v}_{\max}^\top - \displaystyle\dfrac{c(\boldsymbol{A})}{\lambda_{\min}}\boldsymbol{v}_{\min}\boldsymbol{v}_{\min}^\top$
条件:$\boldsymbol{A}$ は対称正定値行列、$c(\boldsymbol{A}) = \lambda_{\max}/\lambda_{\min}$、$\boldsymbol{v}_{\max}$, $\boldsymbol{v}_{\min}$ は対応する正規化固有ベクトル
証明

対称正定値行列 $\boldsymbol{A}$ の条件数 $c(\boldsymbol{A}) = \lambda_{\max} / \lambda_{\min}$ の微分を求める。ここで $\lambda_{\max}$、$\lambda_{\min}$ はそれぞれ $\boldsymbol{A}$ の最大固有値と最小固有値である。

条件数を分子と分母に分解する。

\begin{equation}c(\boldsymbol{A}) = \dfrac{\lambda_{\max}}{\lambda_{\min}} \label{eq:15-6-1}\end{equation}

商の微分公式(1.28)を適用する。$u = \lambda_{\max}$、$v = \lambda_{\min}$ とおくと

\begin{equation}\dfrac{\partial c}{\partial \boldsymbol{A}} = \dfrac{\partial}{\partial \boldsymbol{A}} \left( \dfrac{u}{v} \right) = \dfrac{1}{v} \dfrac{\partial u}{\partial \boldsymbol{A}} - \dfrac{u}{v^2} \dfrac{\partial v}{\partial \boldsymbol{A}} \label{eq:15-6-2}\end{equation}

$\eqref{eq:15-6-2}$ に $u = \lambda_{\max}$、$v = \lambda_{\min}$ を代入する。

\begin{equation}\dfrac{\partial c}{\partial \boldsymbol{A}} = \dfrac{1}{\lambda_{\min}} \dfrac{\partial \lambda_{\max}}{\partial \boldsymbol{A}} - \dfrac{\lambda_{\max}}{\lambda_{\min}^2} \dfrac{\partial \lambda_{\min}}{\partial \boldsymbol{A}} \label{eq:15-6-3}\end{equation}

固有値の微分公式を適用する。9.3 より、対称行列 $\boldsymbol{A}$ の単純固有値 $\lambda_i$ に対して

\begin{equation}\dfrac{\partial \lambda_i}{\partial \boldsymbol{A}} = \boldsymbol{v}_i \boldsymbol{v}_i^\top \label{eq:15-6-4}\end{equation}

ここで $\boldsymbol{v}_i$ は $\lambda_i$ に対応する正規化固有ベクトル($\|\boldsymbol{v}_i\| = 1$)である。

$\eqref{eq:15-6-4}$ を $\lambda_{\max}$ と $\lambda_{\min}$ に適用する。

\begin{equation}\dfrac{\partial \lambda_{\max}}{\partial \boldsymbol{A}} = \boldsymbol{v}_{\max} \boldsymbol{v}_{\max}^\top \label{eq:15-6-5}\end{equation}

\begin{equation}\dfrac{\partial \lambda_{\min}}{\partial \boldsymbol{A}} = \boldsymbol{v}_{\min} \boldsymbol{v}_{\min}^\top \label{eq:15-6-6}\end{equation}

$\eqref{eq:15-6-5}$ と $\eqref{eq:15-6-6}$ を $\eqref{eq:15-6-3}$ に代入する。

\begin{equation}\dfrac{\partial c}{\partial \boldsymbol{A}} = \dfrac{1}{\lambda_{\min}} \boldsymbol{v}_{\max} \boldsymbol{v}_{\max}^\top - \dfrac{\lambda_{\max}}{\lambda_{\min}^2} \boldsymbol{v}_{\min} \boldsymbol{v}_{\min}^\top \label{eq:15-6-7}\end{equation}

第2項を整理する。$\eqref{eq:15-6-1}$ より $c = \lambda_{\max} / \lambda_{\min}$ であるから

\begin{equation}\dfrac{\lambda_{\max}}{\lambda_{\min}^2} = \dfrac{\lambda_{\max}}{\lambda_{\min}} \cdot \dfrac{1}{\lambda_{\min}} = \dfrac{c}{\lambda_{\min}} \label{eq:15-6-8}\end{equation}

$\eqref{eq:15-6-8}$ を $\eqref{eq:15-6-7}$ に代入すると、最終結果を得る。

\begin{equation}\dfrac{\partial c(\boldsymbol{A})}{\partial \boldsymbol{A}} = \dfrac{1}{\lambda_{\min}} \boldsymbol{v}_{\max} \boldsymbol{v}_{\max}^\top - \dfrac{c(\boldsymbol{A})}{\lambda_{\min}} \boldsymbol{v}_{\min} \boldsymbol{v}_{\min}^\top \label{eq:15-6-9}\end{equation}

補足:$\lambda_{\max}$ と $\lambda_{\min}$ が単純固有値の場合に成り立つ。$\eqref{eq:15-6-9}$ の第1項は正($\boldsymbol{v}_{\max} \boldsymbol{v}_{\max}^\top$ は半正定値)、第2項は負である。これは、最大固有値方向に $\boldsymbol{A}$ を摂動すると条件数が増加し、最小固有値方向に摂動すると条件数が減少することを意味する。

参考文献

  • Petersen, K. B., & Pedersen, M. S. (2012). The Matrix Cookbook. Technical University of Denmark.
  • Magnus, J. R., & Neudecker, H. (1999). Matrix Differential Calculus with Applications in Statistics and Econometrics (Revised ed.). Wiley.
  • Matrix calculus - Wikipedia