証明集 第16章: 複素行列の微分
Proofs Chapter 16: Derivatives of Complex Matrices
本章では複素行列の微分をWirtinger微分の枠組みで証明する。 複素微分は独立成分分析(ICA)、適応フィルタリング、 MIMOアンテナの信号処理、量子情報理論における密度行列の最適化など、 信号処理と通信工学で不可欠な数学的道具である。 Wirtinger微分により、正則でない関数(絶対値の二乗など)の勾配を 実部・虚部に分解することなく直接計算できる。
前提知識: 第5章(トレースの微分)、 第7章(行列式の微分)。 関連する章: 第15章(特殊行列の微分)。
16. 複素行列の微分
本章の公式は、特に断りのない限り、以下の条件下で成立する:
- すべての公式は分母レイアウト(denominator layout)に基づく
- 複素微分にはWirtinger導関数($\frac{\partial}{\partial z}$ と $\frac{\partial}{\partial z^*}$)を使用
- 実数値関数の勾配は $\frac{\partial f}{\partial z^*}$ で与えられる
複素共役を含む関数のWirtinger微分と、複素トレースの微分公式を導出する。
16.1 Wirtinger微分
証明
複素数 $z$ を実部と虚部に分解する。
\begin{equation}z = x + iy \label{eq:16-1-1}\end{equation}
ここで $x = \Re z$、$y = \Im z$ である。
$\eqref{eq:16-1-1}$ より、$z$ と $z^*$ を $x$、$y$ で表すと
\begin{equation}z = x + iy, \quad z^* = x - iy \label{eq:16-1-2}\end{equation}
$\eqref{eq:16-1-2}$ を $x$、$y$ について解く。2式を加えると
\begin{equation}z + z^* = 2x \quad \Rightarrow \quad x = \frac{z + z^*}{2} \label{eq:16-1-3}\end{equation}
2式を引くと
\begin{equation}z - z^* = 2iy \quad \Rightarrow \quad y = \frac{z - z^*}{2i} \label{eq:16-1-4}\end{equation}
$f(z)$ を $f(x, y)$ とみなし、連鎖律を適用する。$f$ を $z$ で偏微分すると
\begin{equation}\frac{\partial f}{\partial z} = \frac{\partial f}{\partial x}\frac{\partial x}{\partial z} + \frac{\partial f}{\partial y}\frac{\partial y}{\partial z} \label{eq:16-1-5}\end{equation}
$\eqref{eq:16-1-3}$ より $\partial x / \partial z$ を計算する。$z^*$ を定数とみなすと
\begin{equation}\frac{\partial x}{\partial z} = \frac{1}{2} \label{eq:16-1-6}\end{equation}
$\eqref{eq:16-1-4}$ より $\partial y / \partial z$ を計算する。
\begin{equation}\frac{\partial y}{\partial z} = \frac{1}{2i} = -\frac{i}{2} \label{eq:16-1-7}\end{equation}
$\eqref{eq:16-1-6}$ と $\eqref{eq:16-1-7}$ を $\eqref{eq:16-1-5}$ に代入する。
\begin{equation}\frac{\partial f}{\partial z} = \frac{\partial f}{\partial x} \cdot \frac{1}{2} + \frac{\partial f}{\partial y} \cdot \left(-\frac{i}{2}\right) = \frac{1}{2}\left(\frac{\partial f}{\partial x} - i\frac{\partial f}{\partial y}\right) \label{eq:16-1-8}\end{equation}
同様に $f$ を $z^*$ で偏微分する。
\begin{equation}\frac{\partial f}{\partial z^*} = \frac{\partial f}{\partial x}\frac{\partial x}{\partial z^*} + \frac{\partial f}{\partial y}\frac{\partial y}{\partial z^*} \label{eq:16-1-9}\end{equation}
$\eqref{eq:16-1-3}$ より $\partial x / \partial z^*$ を計算する。$z$ を定数とみなすと
\begin{equation}\frac{\partial x}{\partial z^*} = \frac{1}{2} \label{eq:16-1-10}\end{equation}
$\eqref{eq:16-1-4}$ より $\partial y / \partial z^*$ を計算する。
\begin{equation}\frac{\partial y}{\partial z^*} = -\frac{1}{2i} = \frac{i}{2} \label{eq:16-1-11}\end{equation}
$\eqref{eq:16-1-10}$ と $\eqref{eq:16-1-11}$ を $\eqref{eq:16-1-9}$ に代入する。
\begin{equation}\frac{\partial f}{\partial z^*} = \frac{\partial f}{\partial x} \cdot \frac{1}{2} + \frac{\partial f}{\partial y} \cdot \frac{i}{2} = \frac{1}{2}\left(\frac{\partial f}{\partial x} + i\frac{\partial f}{\partial y}\right) \label{eq:16-1-12}\end{equation}
$x = \Re z$、$y = \Im z$ を代入すると、最終結果を得る。
\begin{equation}\frac{\partial f}{\partial z} = \frac{1}{2}\left(\frac{\partial f}{\partial \Re z} - i\frac{\partial f}{\partial \Im z}\right) \label{eq:16-1-13}\end{equation}
\begin{equation}\frac{\partial f}{\partial z^*} = \frac{1}{2}\left(\frac{\partial f}{\partial \Re z} + i\frac{\partial f}{\partial \Im z}\right) \label{eq:16-1-14}\end{equation}
出典:W. Wirtinger (1927) "Zur formalen Theorie der Funktionen von mehr komplexen Veränderlichen", Mathematische Annalen 97, 357-375.
16.2 複素勾配ベクトル
証明
実数値関数 $f(\boldsymbol{z})$ の複素勾配を定義する。$f$ は実数値なので $f = f^*$ が成り立つ。
16.1 の $\eqref{eq:16-1-14}$ より、成分ごとのWirtinger微分は
\begin{equation}\frac{\partial f}{\partial z_k^*} = \frac{1}{2}\left(\frac{\partial f}{\partial x_k} + i\frac{\partial f}{\partial y_k}\right) \label{eq:16-2-1}\end{equation}
ここで $z_k = x_k + iy_k$($x_k = \Re z_k$、$y_k = \Im z_k$)である。
$\eqref{eq:16-2-1}$ の両辺を 2 倍する。
\begin{equation}2\frac{\partial f}{\partial z_k^*} = \frac{\partial f}{\partial x_k} + i\frac{\partial f}{\partial y_k} \label{eq:16-2-2}\end{equation}
$\eqref{eq:16-2-2}$ をベクトル形式で書く。
\begin{equation}2\frac{\partial f}{\partial \boldsymbol{z}^*} = \frac{\partial f}{\partial \Re\boldsymbol{z}} + i\frac{\partial f}{\partial \Im\boldsymbol{z}} \label{eq:16-2-3}\end{equation}
複素勾配 $\nabla f$ を $\eqref{eq:16-2-3}$ の右辺で定義する。
\begin{equation}\nabla f(\boldsymbol{z}) \stackrel{\text{def}}{=} \frac{\partial f}{\partial \Re\boldsymbol{z}} + i\frac{\partial f}{\partial \Im\boldsymbol{z}} = 2\frac{\partial f}{\partial \boldsymbol{z}^*} \label{eq:16-2-4}\end{equation}
この定義が最急降下方向を与えることを確認する。$f$ の全微分は
\begin{equation}df = \sum_k \left(\frac{\partial f}{\partial x_k}dx_k + \frac{\partial f}{\partial y_k}dy_k\right) \label{eq:16-2-5}\end{equation}
$dz_k = dx_k + idy_k$、$dz_k^* = dx_k - idy_k$ より
\begin{equation}dx_k = \frac{dz_k + dz_k^*}{2}, \quad dy_k = \frac{dz_k - dz_k^*}{2i} \label{eq:16-2-6}\end{equation}
$\eqref{eq:16-2-6}$ を $\eqref{eq:16-2-5}$ に代入して整理すると
\begin{equation}df = \sum_k \left(\frac{\partial f}{\partial z_k}dz_k + \frac{\partial f}{\partial z_k^*}dz_k^*\right) \label{eq:16-2-7}\end{equation}
$f$ が実数値のとき、$\partial f/\partial z_k = (\partial f/\partial z_k^*)^*$ が成り立つ。これを $\eqref{eq:16-2-7}$ に代入し、$d\boldsymbol{z}$ の方向を固定して $df$ を最小化すると、最急降下方向は $-\nabla f = -2\partial f/\partial \boldsymbol{z}^*$ であることがわかる。
16.3 複素微分の連鎖律
証明
合成関数 $h(z) = g(f(z), f^*(z))$ を考える。Wirtinger微分では $f$ と $f^*$ を独立変数として扱う。
$h$ を実部と虚部で書く。$z = x + iy$、$f = u + iv$ とおくと
\begin{equation}h = h(x, y), \quad f = f(x, y) = u(x, y) + iv(x, y) \label{eq:16-3-1}\end{equation}
$h$ の $z$ についてのWirtinger微分は、16.1 の $\eqref{eq:16-1-13}$ より
\begin{equation}\frac{\partial h}{\partial z} = \frac{1}{2}\left(\frac{\partial h}{\partial x} - i\frac{\partial h}{\partial y}\right) \label{eq:16-3-2}\end{equation}
$h$ は $f$ と $f^*$ を通じて $x$、$y$ に依存するので、連鎖律を適用する。
\begin{equation}\frac{\partial h}{\partial x} = \frac{\partial g}{\partial f}\frac{\partial f}{\partial x} + \frac{\partial g}{\partial f^*}\frac{\partial f^*}{\partial x} \label{eq:16-3-3}\end{equation}
\begin{equation}\frac{\partial h}{\partial y} = \frac{\partial g}{\partial f}\frac{\partial f}{\partial y} + \frac{\partial g}{\partial f^*}\frac{\partial f^*}{\partial y} \label{eq:16-3-4}\end{equation}
$\eqref{eq:16-3-3}$ と $\eqref{eq:16-3-4}$ を $\eqref{eq:16-3-2}$ に代入する。
\begin{equation}\frac{\partial h}{\partial z} = \frac{1}{2}\left[\frac{\partial g}{\partial f}\left(\frac{\partial f}{\partial x} - i\frac{\partial f}{\partial y}\right) + \frac{\partial g}{\partial f^*}\left(\frac{\partial f^*}{\partial x} - i\frac{\partial f^*}{\partial y}\right)\right] \label{eq:16-3-5}\end{equation}
16.1 の $\eqref{eq:16-1-13}$ より
\begin{equation}\frac{\partial f}{\partial z} = \frac{1}{2}\left(\frac{\partial f}{\partial x} - i\frac{\partial f}{\partial y}\right) \label{eq:16-3-6}\end{equation}
\begin{equation}\frac{\partial f^*}{\partial z} = \frac{1}{2}\left(\frac{\partial f^*}{\partial x} - i\frac{\partial f^*}{\partial y}\right) \label{eq:16-3-7}\end{equation}
$\eqref{eq:16-3-6}$ と $\eqref{eq:16-3-7}$ を $\eqref{eq:16-3-5}$ に代入する。
\begin{equation}\frac{\partial h}{\partial z} = \frac{\partial g}{\partial f}\frac{\partial f}{\partial z} + \frac{\partial g}{\partial f^*}\frac{\partial f^*}{\partial z} \label{eq:16-3-8}\end{equation}
同様に、$h$ の $z^*$ についてのWirtinger微分を計算する。16.1 の $\eqref{eq:16-1-14}$ より
\begin{equation}\frac{\partial h}{\partial z^*} = \frac{1}{2}\left(\frac{\partial h}{\partial x} + i\frac{\partial h}{\partial y}\right) \label{eq:16-3-9}\end{equation}
$\eqref{eq:16-3-3}$ と $\eqref{eq:16-3-4}$ を $\eqref{eq:16-3-9}$ に代入する。
\begin{equation}\frac{\partial h}{\partial z^*} = \frac{1}{2}\left[\frac{\partial g}{\partial f}\left(\frac{\partial f}{\partial x} + i\frac{\partial f}{\partial y}\right) + \frac{\partial g}{\partial f^*}\left(\frac{\partial f^*}{\partial x} + i\frac{\partial f^*}{\partial y}\right)\right] \label{eq:16-3-10}\end{equation}
16.1 の $\eqref{eq:16-1-14}$ より
\begin{equation}\frac{\partial f}{\partial z^*} = \frac{1}{2}\left(\frac{\partial f}{\partial x} + i\frac{\partial f}{\partial y}\right) \label{eq:16-3-11}\end{equation}
\begin{equation}\frac{\partial f^*}{\partial z^*} = \frac{1}{2}\left(\frac{\partial f^*}{\partial x} + i\frac{\partial f^*}{\partial y}\right) \label{eq:16-3-12}\end{equation}
$\eqref{eq:16-3-11}$ と $\eqref{eq:16-3-12}$ を $\eqref{eq:16-3-10}$ に代入する。
\begin{equation}\frac{\partial h}{\partial z^*} = \frac{\partial g}{\partial f}\frac{\partial f}{\partial z^*} + \frac{\partial g}{\partial f^*}\frac{\partial f^*}{\partial z^*} \label{eq:16-3-13}\end{equation}
16.4 $\text{Tr}(\boldsymbol{X}^*)$ の微分
証明
行列 $\boldsymbol{X}$ の成分を実部と虚部に分解する。
\begin{equation}X_{ij} = (\Re X)_{ij} + i(\Im X)_{ij} \label{eq:16-4-1}\end{equation}
複素共役は
\begin{equation}X_{ij}^* = (\Re X)_{ij} - i(\Im X)_{ij} \label{eq:16-4-2}\end{equation}
トレースの定義より
\begin{equation}\text{Tr}(\boldsymbol{X}^*) = \sum_{i=0}^{n-1} X_{ii}^* \label{eq:16-4-3}\end{equation}
$\eqref{eq:16-4-2}$ を $\eqref{eq:16-4-3}$ に代入する。
\begin{equation}\text{Tr}(\boldsymbol{X}^*) = \sum_{i=0}^{n-1} \left[(\Re X)_{ii} - i(\Im X)_{ii}\right] \label{eq:16-4-4}\end{equation}
$\eqref{eq:16-4-4}$ を実部で偏微分する。$(k, l)$ 成分について
\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X}^*)}{\partial (\Re X)_{kl}} = \frac{\partial}{\partial (\Re X)_{kl}} \sum_{i=0}^{n-1} (\Re X)_{ii} = \delta_{kl} \label{eq:16-4-5}\end{equation}
ここで $\delta_{kl}$ はKroneckerのデルタである。
$\eqref{eq:16-4-5}$ を行列形式で書く。
\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X}^*)}{\partial \Re\boldsymbol{X}} = \boldsymbol{I} \label{eq:16-4-6}\end{equation}
同様に、$\eqref{eq:16-4-4}$ を虚部で偏微分する。
\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X}^*)}{\partial (\Im X)_{kl}} = \frac{\partial}{\partial (\Im X)_{kl}} \sum_{i=0}^{n-1} (-i)(\Im X)_{ii} = -i\delta_{kl} \label{eq:16-4-7}\end{equation}
$\eqref{eq:16-4-7}$ を行列形式で書く。
\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X}^*)}{\partial \Im\boldsymbol{X}} = -i\boldsymbol{I} \label{eq:16-4-8}\end{equation}
$\eqref{eq:16-4-8}$ の両辺に $i$ を掛けると
\begin{equation}i \cdot \frac{\partial \text{Tr}(\boldsymbol{X}^*)}{\partial \Im\boldsymbol{X}} = i \cdot (-i)\boldsymbol{I} = \boldsymbol{I} \label{eq:16-4-9}\end{equation}
$\eqref{eq:16-4-6}$ と $\eqref{eq:16-4-9}$ より、実部と虚部の微分($i$ を掛けた後)が同じ符号 $\boldsymbol{I}$ を持つことがわかる。
16.5 $\text{Tr}(\boldsymbol{X})$ の微分
証明
行列 $\boldsymbol{X}$ の成分を実部と虚部に分解する。
\begin{equation}X_{ij} = (\Re X)_{ij} + i(\Im X)_{ij} \label{eq:16-5-1}\end{equation}
トレースの定義より
\begin{equation}\text{Tr}(\boldsymbol{X}) = \sum_{i=0}^{n-1} X_{ii} \label{eq:16-5-2}\end{equation}
$\eqref{eq:16-5-1}$ を $\eqref{eq:16-5-2}$ に代入する。
\begin{equation}\text{Tr}(\boldsymbol{X}) = \sum_{i=0}^{n-1} \left[(\Re X)_{ii} + i(\Im X)_{ii}\right] \label{eq:16-5-3}\end{equation}
$\eqref{eq:16-5-3}$ を実部で偏微分する。$(k, l)$ 成分について
\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X})}{\partial (\Re X)_{kl}} = \frac{\partial}{\partial (\Re X)_{kl}} \sum_{i=0}^{n-1} (\Re X)_{ii} = \delta_{kl} \label{eq:16-5-4}\end{equation}
$\eqref{eq:16-5-4}$ を行列形式で書く。
\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X})}{\partial \Re\boldsymbol{X}} = \boldsymbol{I} \label{eq:16-5-5}\end{equation}
同様に、$\eqref{eq:16-5-3}$ を虚部で偏微分する。
\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X})}{\partial (\Im X)_{kl}} = \frac{\partial}{\partial (\Im X)_{kl}} \sum_{i=0}^{n-1} i(\Im X)_{ii} = i\delta_{kl} \label{eq:16-5-6}\end{equation}
$\eqref{eq:16-5-6}$ を行列形式で書く。
\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X})}{\partial \Im\boldsymbol{X}} = i\boldsymbol{I} \label{eq:16-5-7}\end{equation}
$\eqref{eq:16-5-7}$ の両辺に $i$ を掛けると
\begin{equation}i \cdot \frac{\partial \text{Tr}(\boldsymbol{X})}{\partial \Im\boldsymbol{X}} = i \cdot i\boldsymbol{I} = -\boldsymbol{I} \label{eq:16-5-8}\end{equation}
$\eqref{eq:16-5-5}$ と $\eqref{eq:16-5-8}$ を比較すると、実部と虚部の微分($i$ を掛けた後)は異なる符号を持つ。これは 16.4 の $\text{Tr}(\boldsymbol{X}^*)$ の場合と対照的である。
16.6 $\text{Tr}(\boldsymbol{A}\boldsymbol{X}^H)$ の微分
証明
Hermite転置の定義より
\begin{equation}(\boldsymbol{X}^H)_{ij} = X_{ji}^* = (\Re X)_{ji} - i(\Im X)_{ji} \label{eq:16-6-1}\end{equation}
トレースを成分で展開する。
\begin{equation}\text{Tr}(\boldsymbol{A}\boldsymbol{X}^H) = \sum_{i,j} A_{ij} (\boldsymbol{X}^H)_{ji} = \sum_{i,j} A_{ij} X_{ij}^* \label{eq:16-6-2}\end{equation}
$\eqref{eq:16-6-1}$ の形式を用いて $\eqref{eq:16-6-2}$ を書き直す。
\begin{equation}\text{Tr}(\boldsymbol{A}\boldsymbol{X}^H) = \sum_{i,j} A_{ij} \left[(\Re X)_{ij} - i(\Im X)_{ij}\right] \label{eq:16-6-3}\end{equation}
$\eqref{eq:16-6-3}$ を実部で偏微分する。$(k, l)$ 成分について
\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{A}\boldsymbol{X}^H)}{\partial (\Re X)_{kl}} = \frac{\partial}{\partial (\Re X)_{kl}} \sum_{i,j} A_{ij} (\Re X)_{ij} = A_{kl} \label{eq:16-6-4}\end{equation}
$\eqref{eq:16-6-4}$ を行列形式で書く。
\begin{equation}\left(\frac{\partial \text{Tr}(\boldsymbol{A}\boldsymbol{X}^H)}{\partial \Re\boldsymbol{X}}\right)_{kl} = A_{kl} \label{eq:16-6-5}\end{equation}
$\eqref{eq:16-6-5}$ はそのまま行列 $\boldsymbol{A}$ の $(k,l)$ 成分であるから
\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{A}\boldsymbol{X}^H)}{\partial \Re\boldsymbol{X}} = \boldsymbol{A} \label{eq:16-6-6}\end{equation}
同様に、$\eqref{eq:16-6-3}$ を虚部で偏微分する。
\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{A}\boldsymbol{X}^H)}{\partial (\Im X)_{kl}} = \frac{\partial}{\partial (\Im X)_{kl}} \sum_{i,j} A_{ij} (-i)(\Im X)_{ij} = -iA_{kl} \label{eq:16-6-7}\end{equation}
$\eqref{eq:16-6-7}$ を行列形式で書く。
\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{A}\boldsymbol{X}^H)}{\partial \Im\boldsymbol{X}} = -i\boldsymbol{A} \label{eq:16-6-8}\end{equation}
$\eqref{eq:16-6-8}$ の両辺に $i$ を掛けると
\begin{equation}i \cdot \frac{\partial \text{Tr}(\boldsymbol{A}\boldsymbol{X}^H)}{\partial \Im\boldsymbol{X}} = i \cdot (-i)\boldsymbol{A} = \boldsymbol{A} \label{eq:16-6-9}\end{equation}
$\eqref{eq:16-6-6}$ と $\eqref{eq:16-6-9}$ より、実部と虚部の微分($i$ を掛けた後)は同じ結果 $\boldsymbol{A}$ となる。
16.7 $\text{Tr}(\boldsymbol{A}\boldsymbol{X}^*)$ の微分
証明
トレースを成分で展開する。
\begin{equation}\text{Tr}(\boldsymbol{A}\boldsymbol{X}^*) = \sum_{i,j} A_{ij} (\boldsymbol{X}^*)_{ji} = \sum_{i,j} A_{ij} X_{ji}^* \label{eq:16-7-1}\end{equation}
複素共役を実部と虚部で書く。
\begin{equation}X_{ji}^* = (\Re X)_{ji} - i(\Im X)_{ji} \label{eq:16-7-2}\end{equation}
$\eqref{eq:16-7-2}$ を $\eqref{eq:16-7-1}$ に代入する。
\begin{equation}\text{Tr}(\boldsymbol{A}\boldsymbol{X}^*) = \sum_{i,j} A_{ij} \left[(\Re X)_{ji} - i(\Im X)_{ji}\right] \label{eq:16-7-3}\end{equation}
$\eqref{eq:16-7-3}$ を実部で偏微分する。$(k, l)$ 成分について
\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{A}\boldsymbol{X}^*)}{\partial (\Re X)_{kl}} = \frac{\partial}{\partial (\Re X)_{kl}} \sum_{i,j} A_{ij} (\Re X)_{ji} = A_{lk} \label{eq:16-7-4}\end{equation}
ここで、$(\Re X)_{ji}$ を $(\Re X)_{kl}$ で微分すると $\delta_{jk}\delta_{il}$ が得られ、これを代入すると $A_{lk}$ となる。
$\eqref{eq:16-7-4}$ を行列形式で書く。$(\boldsymbol{A}^\top)_{kl} = A_{lk}$ より
\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{A}\boldsymbol{X}^*)}{\partial \Re\boldsymbol{X}} = \boldsymbol{A}^\top \label{eq:16-7-5}\end{equation}
同様に、$\eqref{eq:16-7-3}$ を虚部で偏微分する。
\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{A}\boldsymbol{X}^*)}{\partial (\Im X)_{kl}} = \frac{\partial}{\partial (\Im X)_{kl}} \sum_{i,j} A_{ij} (-i)(\Im X)_{ji} = -iA_{lk} \label{eq:16-7-6}\end{equation}
$\eqref{eq:16-7-6}$ を行列形式で書く。
\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{A}\boldsymbol{X}^*)}{\partial \Im\boldsymbol{X}} = -i\boldsymbol{A}^\top \label{eq:16-7-7}\end{equation}
$\eqref{eq:16-7-7}$ の両辺に $i$ を掛けると
\begin{equation}i \cdot \frac{\partial \text{Tr}(\boldsymbol{A}\boldsymbol{X}^*)}{\partial \Im\boldsymbol{X}} = \boldsymbol{A}^\top \label{eq:16-7-8}\end{equation}
$\eqref{eq:16-7-5}$ と $\eqref{eq:16-7-8}$ より、16.6 と同じ結果が得られる。
16.8 $\text{Tr}(\boldsymbol{X}\boldsymbol{X}^H)$ の微分
証明
トレースの巡回性(1.12)より
\begin{equation}\text{Tr}(\boldsymbol{X}\boldsymbol{X}^H) = \text{Tr}(\boldsymbol{X}^H\boldsymbol{X}) \label{eq:16-8-1}\end{equation}
$\eqref{eq:16-8-1}$ を成分で展開する。
\begin{equation}\text{Tr}(\boldsymbol{X}\boldsymbol{X}^H) = \sum_{i,j} X_{ij} X_{ij}^* = \sum_{i,j} |X_{ij}|^2 \label{eq:16-8-2}\end{equation}
$\eqref{eq:16-8-2}$ はFrobeniusノルムの2乗である。
\begin{equation}\text{Tr}(\boldsymbol{X}\boldsymbol{X}^H) = \|\boldsymbol{X}\|_F^2 \label{eq:16-8-3}\end{equation}
複素数の絶対値の2乗を実部と虚部で書く。
\begin{equation}|X_{ij}|^2 = (\Re X_{ij})^2 + (\Im X_{ij})^2 \label{eq:16-8-4}\end{equation}
$\eqref{eq:16-8-4}$ を $\eqref{eq:16-8-2}$ に代入する。
\begin{equation}\text{Tr}(\boldsymbol{X}\boldsymbol{X}^H) = \sum_{i,j} \left[(\Re X_{ij})^2 + (\Im X_{ij})^2\right] \label{eq:16-8-5}\end{equation}
$\eqref{eq:16-8-5}$ を実部で偏微分する。$(k, l)$ 成分について
\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X}\boldsymbol{X}^H)}{\partial (\Re X)_{kl}} = \frac{\partial}{\partial (\Re X)_{kl}} \sum_{i,j} (\Re X_{ij})^2 = 2(\Re X)_{kl} \label{eq:16-8-6}\end{equation}
$\eqref{eq:16-8-6}$ を行列形式で書く。
\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X}\boldsymbol{X}^H)}{\partial \Re\boldsymbol{X}} = 2\Re\boldsymbol{X} \label{eq:16-8-7}\end{equation}
同様に、$\eqref{eq:16-8-5}$ を虚部で偏微分する。
\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X}\boldsymbol{X}^H)}{\partial (\Im X)_{kl}} = \frac{\partial}{\partial (\Im X)_{kl}} \sum_{i,j} (\Im X_{ij})^2 = 2(\Im X)_{kl} \label{eq:16-8-8}\end{equation}
$\eqref{eq:16-8-8}$ を行列形式で書く。
\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X}\boldsymbol{X}^H)}{\partial \Im\boldsymbol{X}} = 2\Im\boldsymbol{X} \label{eq:16-8-9}\end{equation}
16.9 $\text{Tr}(\boldsymbol{X}\boldsymbol{X}^H)$ のWirtinger微分
証明
16.1 の $\eqref{eq:16-1-13}$ をベクトルに拡張したWirtinger微分の定義を用いる。
\begin{equation}\frac{\partial f}{\partial \boldsymbol{X}} = \frac{1}{2}\left(\frac{\partial f}{\partial \Re\boldsymbol{X}} - i\frac{\partial f}{\partial \Im\boldsymbol{X}}\right) \label{eq:16-9-1}\end{equation}
16.8 の $\eqref{eq:16-8-7}$ と $\eqref{eq:16-8-9}$ より
\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X}\boldsymbol{X}^H)}{\partial \Re\boldsymbol{X}} = 2\Re\boldsymbol{X}, \quad \frac{\partial \text{Tr}(\boldsymbol{X}\boldsymbol{X}^H)}{\partial \Im\boldsymbol{X}} = 2\Im\boldsymbol{X} \label{eq:16-9-2}\end{equation}
$\eqref{eq:16-9-2}$ を $\eqref{eq:16-9-1}$ に代入する。
\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X}\boldsymbol{X}^H)}{\partial \boldsymbol{X}} = \frac{1}{2}\left(2\Re\boldsymbol{X} - i \cdot 2\Im\boldsymbol{X}\right) = \Re\boldsymbol{X} - i\Im\boldsymbol{X} \label{eq:16-9-3}\end{equation}
複素共役の定義より
\begin{equation}\boldsymbol{X}^* = \Re\boldsymbol{X} - i\Im\boldsymbol{X} \label{eq:16-9-4}\end{equation}
$\eqref{eq:16-9-3}$ と $\eqref{eq:16-9-4}$ より
\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X}\boldsymbol{X}^H)}{\partial \boldsymbol{X}} = \boldsymbol{X}^* \label{eq:16-9-5}\end{equation}
同様に、共役微分の定義(16.1 の $\eqref{eq:16-1-14}$)を用いる。
\begin{equation}\frac{\partial f}{\partial \boldsymbol{X}^*} = \frac{1}{2}\left(\frac{\partial f}{\partial \Re\boldsymbol{X}} + i\frac{\partial f}{\partial \Im\boldsymbol{X}}\right) \label{eq:16-9-6}\end{equation}
$\eqref{eq:16-9-2}$ を $\eqref{eq:16-9-6}$ に代入する。
\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X}\boldsymbol{X}^H)}{\partial \boldsymbol{X}^*} = \frac{1}{2}\left(2\Re\boldsymbol{X} + i \cdot 2\Im\boldsymbol{X}\right) = \Re\boldsymbol{X} + i\Im\boldsymbol{X} = \boldsymbol{X} \label{eq:16-9-7}\end{equation}
16.10 Frobeniusノルムの複素勾配
証明
$\text{Tr}(\boldsymbol{X}\boldsymbol{X}^H) = \|\boldsymbol{X}\|_F^2$ は実数値関数である。
\begin{equation}f = \text{Tr}(\boldsymbol{X}\boldsymbol{X}^H) \in \mathbb{R} \label{eq:16-10-1}\end{equation}
16.2 の $\eqref{eq:16-2-4}$ より、実数値関数の複素勾配は
\begin{equation}\nabla f = 2\frac{\partial f}{\partial \boldsymbol{X}^*} \label{eq:16-10-2}\end{equation}
16.9 の $\eqref{eq:16-9-7}$ より
\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X}\boldsymbol{X}^H)}{\partial \boldsymbol{X}^*} = \boldsymbol{X} \label{eq:16-10-3}\end{equation}
$\eqref{eq:16-10-3}$ を $\eqref{eq:16-10-2}$ に代入する。
\begin{equation}\nabla\text{Tr}(\boldsymbol{X}\boldsymbol{X}^H) = 2\boldsymbol{X} \label{eq:16-10-4}\end{equation}
$\eqref{eq:16-10-1}$ より、$\eqref{eq:16-10-4}$ はFrobeniusノルムの複素勾配を与える。
\begin{equation}\nabla\|\boldsymbol{X}\|_F^2 = 2\boldsymbol{X} \label{eq:16-10-5}\end{equation}
16.11 $\det(\boldsymbol{X}^H\boldsymbol{A}\boldsymbol{X})$ の微分
$\displaystyle\frac{\partial \det(\boldsymbol{X}^H\boldsymbol{A}\boldsymbol{X})}{\partial \boldsymbol{X}^*} = \det(\boldsymbol{X}^H\boldsymbol{A}\boldsymbol{X})\boldsymbol{A}\boldsymbol{X}(\boldsymbol{X}^H\boldsymbol{A}\boldsymbol{X})^{-1}$
証明
補助行列 $\boldsymbol{M}$ を定義する。
\begin{equation}\boldsymbol{M} = \boldsymbol{X}^H\boldsymbol{A}\boldsymbol{X} \label{eq:16-11-1}\end{equation}
行列式の微分公式より
\begin{equation}d(\det\boldsymbol{M}) = \det(\boldsymbol{M})\text{Tr}(\boldsymbol{M}^{-1}d\boldsymbol{M}) \label{eq:16-11-2}\end{equation}
$\eqref{eq:16-11-1}$ を微分する。積の微分法則(1.25)を適用する。
\begin{equation}d\boldsymbol{M} = d(\boldsymbol{X}^H)\boldsymbol{A}\boldsymbol{X} + \boldsymbol{X}^H\boldsymbol{A}(d\boldsymbol{X}) \label{eq:16-11-3}\end{equation}
$\eqref{eq:16-11-3}$ を $\eqref{eq:16-11-2}$ に代入する。
\begin{equation}\text{Tr}(\boldsymbol{M}^{-1}d\boldsymbol{M}) = \text{Tr}(\boldsymbol{M}^{-1}d\boldsymbol{X}^H\boldsymbol{A}\boldsymbol{X}) + \text{Tr}(\boldsymbol{M}^{-1}\boldsymbol{X}^H\boldsymbol{A}\,d\boldsymbol{X}) \label{eq:16-11-4}\end{equation}
トレースの巡回性(1.12)を $\eqref{eq:16-11-4}$ の第1項に適用する。
\begin{equation}\text{Tr}(\boldsymbol{M}^{-1}d\boldsymbol{X}^H\boldsymbol{A}\boldsymbol{X}) = \text{Tr}(\boldsymbol{A}\boldsymbol{X}\boldsymbol{M}^{-1}d\boldsymbol{X}^H) \label{eq:16-11-5}\end{equation}
$\eqref{eq:16-11-4}$ と $\eqref{eq:16-11-5}$ をまとめる。
\begin{equation}\text{Tr}(\boldsymbol{M}^{-1}d\boldsymbol{M}) = \text{Tr}(\boldsymbol{A}\boldsymbol{X}\boldsymbol{M}^{-1}d\boldsymbol{X}^H) + \text{Tr}(\boldsymbol{M}^{-1}\boldsymbol{X}^H\boldsymbol{A}\,d\boldsymbol{X}) \label{eq:16-11-6}\end{equation}
Wirtinger微分では、$d\boldsymbol{X}^H$ に対応する項が $\partial/\partial\boldsymbol{X}^*$ の係数を与え、$d\boldsymbol{X}$ に対応する項が $\partial/\partial\boldsymbol{X}$ の係数を与える。
$\eqref{eq:16-11-6}$ の第1項より、$\partial/\partial\boldsymbol{X}^*$ の微分を読み取る。$\text{Tr}(\boldsymbol{B}d\boldsymbol{X}^H) = \text{Tr}(d\boldsymbol{X}^H\boldsymbol{B})$ の係数行列は $\boldsymbol{B}^\top$ なので
\begin{equation}\frac{\partial \det\boldsymbol{M}}{\partial \boldsymbol{X}^*} = \det\boldsymbol{M} \cdot \boldsymbol{A}\boldsymbol{X}\boldsymbol{M}^{-1} \label{eq:16-11-7}\end{equation}
$\eqref{eq:16-11-6}$ の第2項より、$\partial/\partial\boldsymbol{X}$ の微分を読み取る。$\text{Tr}(\boldsymbol{C}d\boldsymbol{X})$ の係数行列は $\boldsymbol{C}^\top$ なので
\begin{equation}\frac{\partial \det\boldsymbol{M}}{\partial \boldsymbol{X}} = \det\boldsymbol{M} \cdot (\boldsymbol{M}^{-1}\boldsymbol{X}^H\boldsymbol{A})^\top \label{eq:16-11-8}\end{equation}
$\boldsymbol{M} = \boldsymbol{X}^H\boldsymbol{A}\boldsymbol{X}$ を代入して最終結果を得る。
16.12 複素Rayleigh商の微分
証明
Rayleigh商 $R(\boldsymbol{x})$ を定義する。
\begin{equation}R(\boldsymbol{x}) = \frac{(\boldsymbol{A}\boldsymbol{x})^H(\boldsymbol{A}\boldsymbol{x})}{(\boldsymbol{B}\boldsymbol{x})^H(\boldsymbol{B}\boldsymbol{x})} = \frac{\boldsymbol{x}^H\boldsymbol{A}^H\boldsymbol{A}\boldsymbol{x}}{\boldsymbol{x}^H\boldsymbol{B}^H\boldsymbol{B}\boldsymbol{x}} \label{eq:16-12-1}\end{equation}
分子と分母を別々に定義する。
\begin{equation}f = \boldsymbol{x}^H\boldsymbol{A}^H\boldsymbol{A}\boldsymbol{x}, \quad g = \boldsymbol{x}^H\boldsymbol{B}^H\boldsymbol{B}\boldsymbol{x} \label{eq:16-12-2}\end{equation}
商の微分則(1.28)を適用する。
\begin{equation}\frac{\partial R}{\partial \boldsymbol{x}} = \frac{\partial}{\partial \boldsymbol{x}}\left(\frac{f}{g}\right) = \frac{1}{g}\frac{\partial f}{\partial \boldsymbol{x}} - \frac{f}{g^2}\frac{\partial g}{\partial \boldsymbol{x}} \label{eq:16-12-3}\end{equation}
Hermite二次形式 $\boldsymbol{x}^H\boldsymbol{M}\boldsymbol{x}$($\boldsymbol{M}$ はHermite行列)のWirtinger微分を計算する。$\boldsymbol{M} = \boldsymbol{A}^H\boldsymbol{A}$ とおく。
\begin{equation}\frac{\partial (\boldsymbol{x}^H\boldsymbol{M}\boldsymbol{x})}{\partial \boldsymbol{x}} = (\boldsymbol{M}\boldsymbol{x})^* \label{eq:16-12-4}\end{equation}
$\eqref{eq:16-12-4}$ を $f$ と $g$ に適用する。
\begin{equation}\frac{\partial f}{\partial \boldsymbol{x}} = (\boldsymbol{A}^H\boldsymbol{A}\boldsymbol{x})^* \label{eq:16-12-5}\end{equation}
\begin{equation}\frac{\partial g}{\partial \boldsymbol{x}} = (\boldsymbol{B}^H\boldsymbol{B}\boldsymbol{x})^* \label{eq:16-12-6}\end{equation}
複素勾配の定義 $\nabla R = 2\partial R/\partial \boldsymbol{x}^*$ を用いると、$\partial R/\partial \boldsymbol{x}$ は
\begin{equation}\frac{\partial R}{\partial \boldsymbol{x}} = \frac{1}{g}(\boldsymbol{A}^H\boldsymbol{A}\boldsymbol{x})^* - \frac{f}{g^2}(\boldsymbol{B}^H\boldsymbol{B}\boldsymbol{x})^* \label{eq:16-12-7}\end{equation}
複素勾配 $\nabla R = 2\partial R/\partial \boldsymbol{x}^*$ を計算する。実数値関数では $\partial R/\partial \boldsymbol{x}^* = (\partial R/\partial \boldsymbol{x})^*$ ではないことに注意し、直接計算すると
\begin{equation}\nabla R = 2\frac{\boldsymbol{A}^H\boldsymbol{A}\boldsymbol{x}}{\boldsymbol{x}^H\boldsymbol{B}^H\boldsymbol{B}\boldsymbol{x}} - 2\frac{\boldsymbol{x}^H\boldsymbol{A}^H\boldsymbol{A}\boldsymbol{x} \cdot \boldsymbol{B}^H\boldsymbol{B}\boldsymbol{x}}{(\boldsymbol{x}^H\boldsymbol{B}^H\boldsymbol{B}\boldsymbol{x})^2} \label{eq:16-12-8}\end{equation}
16.13 複素二次形式 $(a - \boldsymbol{x}^H \boldsymbol{b})^2$ の微分
証明
補助変数 $z$ を定義する。
\begin{equation}z = a - \boldsymbol{x}^H \boldsymbol{b} = a - \sum_{i=0}^{n-1} \bar{x}_i b_i \label{eq:16-13-1}\end{equation}
スカラ関数 $f$ を定義する。
\begin{equation}f = z^2 = (a - \boldsymbol{x}^H \boldsymbol{b})^2 \label{eq:16-13-2}\end{equation}
Wirtinger微分では $\boldsymbol{x}$ と $\bar{\boldsymbol{x}}$ を独立変数として扱う。$\eqref{eq:16-13-1}$ より、$z$ は $\bar{x}_k$ に依存するが、$x_k$ には直接依存しない。
\begin{equation}\frac{\partial z}{\partial \bar{x}_k} = -b_k \label{eq:16-13-3}\end{equation}
\begin{equation}\frac{\partial z}{\partial x_k} = 0 \label{eq:16-13-4}\end{equation}
$f = z^2$ を連鎖律(1.26)で微分する。
\begin{equation}\frac{\partial f}{\partial \bar{x}_k} = \frac{\partial (z^2)}{\partial z} \cdot \frac{\partial z}{\partial \bar{x}_k} = 2z \cdot (-b_k) = -2b_k z \label{eq:16-13-5}\end{equation}
$\eqref{eq:16-13-5}$ をベクトル形式で書く。
\begin{equation}\frac{\partial f}{\partial \bar{\boldsymbol{x}}} = -2\boldsymbol{b}z \label{eq:16-13-6}\end{equation}
Wirtinger微分の標準的な関係式を用いる。
\begin{equation}\frac{\partial f}{\partial \boldsymbol{x}} = \overline{\frac{\partial f}{\partial \bar{\boldsymbol{x}}}} \label{eq:16-13-7}\end{equation}
$\eqref{eq:16-13-6}$ を $\eqref{eq:16-13-7}$ に代入する。
\begin{equation}\frac{\partial f}{\partial \boldsymbol{x}} = \overline{-2\boldsymbol{b}z} = -2\bar{\boldsymbol{b}} \bar{z} \label{eq:16-13-8}\end{equation}
$\bar{z} = z^*$ であるから
\begin{equation}\frac{\partial (a - \boldsymbol{x}^H \boldsymbol{b})^2}{\partial \boldsymbol{x}} = -2\bar{\boldsymbol{b}} (a - \boldsymbol{x}^H \boldsymbol{b})^* \label{eq:16-13-9}\end{equation}
参考文献
- Petersen, K. B., & Pedersen, M. S. (2012). The Matrix Cookbook. Technical University of Denmark.
- Magnus, J. R., & Neudecker, H. (1999). Matrix Differential Calculus with Applications in Statistics and Econometrics (Revised ed.). Wiley.
- Matrix calculus - Wikipedia