証明集 第16章: 複素行列の微分

Proofs Chapter 16: Derivatives of Complex Matrices

本章では複素行列の微分をWirtinger微分の枠組みで証明する。 複素微分は独立成分分析(ICA)、適応フィルタリング、 MIMOアンテナの信号処理、量子情報理論における密度行列の最適化など、 信号処理と通信工学で不可欠な数学的道具である。 Wirtinger微分により、正則でない関数(絶対値の二乗など)の勾配を 実部・虚部に分解することなく直接計算できる。

前提知識: 第5章(トレースの微分)第7章(行列式の微分)関連する章: 第15章(特殊行列の微分)

16. 複素行列の微分

本章の前提条件
本章の公式は、特に断りのない限り、以下の条件下で成立する:
  • すべての公式は分母レイアウト(denominator layout)に基づく
  • 複素微分にはWirtinger導関数($\frac{\partial}{\partial z}$ と $\frac{\partial}{\partial z^*}$)を使用
  • 実数値関数の勾配は $\frac{\partial f}{\partial z^*}$ で与えられる

複素共役を含む関数のWirtinger微分と、複素トレースの微分公式を導出する。

16.1 Wirtinger微分

公式:$\displaystyle\frac{\partial f}{\partial z} = \displaystyle\frac{1}{2}\left(\displaystyle\frac{\partial f}{\partial \Re z} - i\displaystyle\frac{\partial f}{\partial \Im z}\right)$, $\quad\displaystyle\frac{\partial f}{\partial z^*} = \displaystyle\frac{1}{2}\left(\displaystyle\frac{\partial f}{\partial \Re z} + i\displaystyle\frac{\partial f}{\partial \Im z}\right)$
条件:$f$ は複素関数、$z = \Re z + i\Im z$
証明

複素数 $z$ を実部と虚部に分解する。

\begin{equation}z = x + iy \label{eq:16-1-1}\end{equation}

ここで $x = \Re z$、$y = \Im z$ である。

$\eqref{eq:16-1-1}$ より、$z$ と $z^*$ を $x$、$y$ で表すと

\begin{equation}z = x + iy, \quad z^* = x - iy \label{eq:16-1-2}\end{equation}

$\eqref{eq:16-1-2}$ を $x$、$y$ について解く。2式を加えると

\begin{equation}z + z^* = 2x \quad \Rightarrow \quad x = \frac{z + z^*}{2} \label{eq:16-1-3}\end{equation}

2式を引くと

\begin{equation}z - z^* = 2iy \quad \Rightarrow \quad y = \frac{z - z^*}{2i} \label{eq:16-1-4}\end{equation}

$f(z)$ を $f(x, y)$ とみなし、連鎖律を適用する。$f$ を $z$ で偏微分すると

\begin{equation}\frac{\partial f}{\partial z} = \frac{\partial f}{\partial x}\frac{\partial x}{\partial z} + \frac{\partial f}{\partial y}\frac{\partial y}{\partial z} \label{eq:16-1-5}\end{equation}

$\eqref{eq:16-1-3}$ より $\partial x / \partial z$ を計算する。$z^*$ を定数とみなすと

\begin{equation}\frac{\partial x}{\partial z} = \frac{1}{2} \label{eq:16-1-6}\end{equation}

$\eqref{eq:16-1-4}$ より $\partial y / \partial z$ を計算する。

\begin{equation}\frac{\partial y}{\partial z} = \frac{1}{2i} = -\frac{i}{2} \label{eq:16-1-7}\end{equation}

$\eqref{eq:16-1-6}$ と $\eqref{eq:16-1-7}$ を $\eqref{eq:16-1-5}$ に代入する。

\begin{equation}\frac{\partial f}{\partial z} = \frac{\partial f}{\partial x} \cdot \frac{1}{2} + \frac{\partial f}{\partial y} \cdot \left(-\frac{i}{2}\right) = \frac{1}{2}\left(\frac{\partial f}{\partial x} - i\frac{\partial f}{\partial y}\right) \label{eq:16-1-8}\end{equation}

同様に $f$ を $z^*$ で偏微分する。

\begin{equation}\frac{\partial f}{\partial z^*} = \frac{\partial f}{\partial x}\frac{\partial x}{\partial z^*} + \frac{\partial f}{\partial y}\frac{\partial y}{\partial z^*} \label{eq:16-1-9}\end{equation}

$\eqref{eq:16-1-3}$ より $\partial x / \partial z^*$ を計算する。$z$ を定数とみなすと

\begin{equation}\frac{\partial x}{\partial z^*} = \frac{1}{2} \label{eq:16-1-10}\end{equation}

$\eqref{eq:16-1-4}$ より $\partial y / \partial z^*$ を計算する。

\begin{equation}\frac{\partial y}{\partial z^*} = -\frac{1}{2i} = \frac{i}{2} \label{eq:16-1-11}\end{equation}

$\eqref{eq:16-1-10}$ と $\eqref{eq:16-1-11}$ を $\eqref{eq:16-1-9}$ に代入する。

\begin{equation}\frac{\partial f}{\partial z^*} = \frac{\partial f}{\partial x} \cdot \frac{1}{2} + \frac{\partial f}{\partial y} \cdot \frac{i}{2} = \frac{1}{2}\left(\frac{\partial f}{\partial x} + i\frac{\partial f}{\partial y}\right) \label{eq:16-1-12}\end{equation}

$x = \Re z$、$y = \Im z$ を代入すると、最終結果を得る。

\begin{equation}\frac{\partial f}{\partial z} = \frac{1}{2}\left(\frac{\partial f}{\partial \Re z} - i\frac{\partial f}{\partial \Im z}\right) \label{eq:16-1-13}\end{equation}

\begin{equation}\frac{\partial f}{\partial z^*} = \frac{1}{2}\left(\frac{\partial f}{\partial \Re z} + i\frac{\partial f}{\partial \Im z}\right) \label{eq:16-1-14}\end{equation}

補足:複素共役を含む関数(例:$f(z) = z^*$)はコーシー・リーマン方程式を満たさないため通常の意味では微分できない。Wirtinger微分はこの問題を回避する。$f$ が正則な場合、$\partial f/\partial z$ は通常の複素微分と一致し、$\partial f/\partial z^* = 0$ となる。
出典:W. Wirtinger (1927) "Zur formalen Theorie der Funktionen von mehr komplexen Veränderlichen", Mathematische Annalen 97, 357-375.

16.2 複素勾配ベクトル

公式:$\nabla f(\boldsymbol{z}) = 2\displaystyle\frac{\partial f(\boldsymbol{z})}{\partial \boldsymbol{z}^*} = \displaystyle\frac{\partial f(\boldsymbol{z})}{\partial \Re\boldsymbol{z}} + i\displaystyle\frac{\partial f(\boldsymbol{z})}{\partial \Im\boldsymbol{z}}$
条件:$f(\boldsymbol{z})$ は実数値関数、$\boldsymbol{z} \in \mathbb{C}^n$
証明

実数値関数 $f(\boldsymbol{z})$ の複素勾配を定義する。$f$ は実数値なので $f = f^*$ が成り立つ。

16.1 の $\eqref{eq:16-1-14}$ より、成分ごとのWirtinger微分は

\begin{equation}\frac{\partial f}{\partial z_k^*} = \frac{1}{2}\left(\frac{\partial f}{\partial x_k} + i\frac{\partial f}{\partial y_k}\right) \label{eq:16-2-1}\end{equation}

ここで $z_k = x_k + iy_k$($x_k = \Re z_k$、$y_k = \Im z_k$)である。

$\eqref{eq:16-2-1}$ の両辺を 2 倍する。

\begin{equation}2\frac{\partial f}{\partial z_k^*} = \frac{\partial f}{\partial x_k} + i\frac{\partial f}{\partial y_k} \label{eq:16-2-2}\end{equation}

$\eqref{eq:16-2-2}$ をベクトル形式で書く。

\begin{equation}2\frac{\partial f}{\partial \boldsymbol{z}^*} = \frac{\partial f}{\partial \Re\boldsymbol{z}} + i\frac{\partial f}{\partial \Im\boldsymbol{z}} \label{eq:16-2-3}\end{equation}

複素勾配 $\nabla f$ を $\eqref{eq:16-2-3}$ の右辺で定義する。

\begin{equation}\nabla f(\boldsymbol{z}) \stackrel{\text{def}}{=} \frac{\partial f}{\partial \Re\boldsymbol{z}} + i\frac{\partial f}{\partial \Im\boldsymbol{z}} = 2\frac{\partial f}{\partial \boldsymbol{z}^*} \label{eq:16-2-4}\end{equation}

この定義が最急降下方向を与えることを確認する。$f$ の全微分は

\begin{equation}df = \sum_k \left(\frac{\partial f}{\partial x_k}dx_k + \frac{\partial f}{\partial y_k}dy_k\right) \label{eq:16-2-5}\end{equation}

$dz_k = dx_k + idy_k$、$dz_k^* = dx_k - idy_k$ より

\begin{equation}dx_k = \frac{dz_k + dz_k^*}{2}, \quad dy_k = \frac{dz_k - dz_k^*}{2i} \label{eq:16-2-6}\end{equation}

$\eqref{eq:16-2-6}$ を $\eqref{eq:16-2-5}$ に代入して整理すると

\begin{equation}df = \sum_k \left(\frac{\partial f}{\partial z_k}dz_k + \frac{\partial f}{\partial z_k^*}dz_k^*\right) \label{eq:16-2-7}\end{equation}

$f$ が実数値のとき、$\partial f/\partial z_k = (\partial f/\partial z_k^*)^*$ が成り立つ。これを $\eqref{eq:16-2-7}$ に代入し、$d\boldsymbol{z}$ の方向を固定して $df$ を最小化すると、最急降下方向は $-\nabla f = -2\partial f/\partial \boldsymbol{z}^*$ であることがわかる。

補足:この定義により、実数の場合と同様に $-\nabla f$ の方向が最急降下方向となる。複素ニューラルネットワークや適応フィルタの最適化で使用される。

16.3 複素微分の連鎖律

公式:$\displaystyle\frac{\partial g}{\partial z} = \displaystyle\frac{\partial g}{\partial f}\displaystyle\frac{\partial f}{\partial z} + \displaystyle\frac{\partial g}{\partial f^*}\displaystyle\frac{\partial f^*}{\partial z}$, $\quad\displaystyle\frac{\partial g}{\partial z^*} = \displaystyle\frac{\partial g}{\partial f}\displaystyle\frac{\partial f}{\partial z^*} + \displaystyle\frac{\partial g}{\partial f^*}\displaystyle\frac{\partial f^*}{\partial z^*}$
条件:$g(f(z))$ は合成関数
証明

合成関数 $h(z) = g(f(z), f^*(z))$ を考える。Wirtinger微分では $f$ と $f^*$ を独立変数として扱う。

$h$ を実部と虚部で書く。$z = x + iy$、$f = u + iv$ とおくと

\begin{equation}h = h(x, y), \quad f = f(x, y) = u(x, y) + iv(x, y) \label{eq:16-3-1}\end{equation}

$h$ の $z$ についてのWirtinger微分は、16.1 の $\eqref{eq:16-1-13}$ より

\begin{equation}\frac{\partial h}{\partial z} = \frac{1}{2}\left(\frac{\partial h}{\partial x} - i\frac{\partial h}{\partial y}\right) \label{eq:16-3-2}\end{equation}

$h$ は $f$ と $f^*$ を通じて $x$、$y$ に依存するので、連鎖律を適用する。

\begin{equation}\frac{\partial h}{\partial x} = \frac{\partial g}{\partial f}\frac{\partial f}{\partial x} + \frac{\partial g}{\partial f^*}\frac{\partial f^*}{\partial x} \label{eq:16-3-3}\end{equation}

\begin{equation}\frac{\partial h}{\partial y} = \frac{\partial g}{\partial f}\frac{\partial f}{\partial y} + \frac{\partial g}{\partial f^*}\frac{\partial f^*}{\partial y} \label{eq:16-3-4}\end{equation}

$\eqref{eq:16-3-3}$ と $\eqref{eq:16-3-4}$ を $\eqref{eq:16-3-2}$ に代入する。

\begin{equation}\frac{\partial h}{\partial z} = \frac{1}{2}\left[\frac{\partial g}{\partial f}\left(\frac{\partial f}{\partial x} - i\frac{\partial f}{\partial y}\right) + \frac{\partial g}{\partial f^*}\left(\frac{\partial f^*}{\partial x} - i\frac{\partial f^*}{\partial y}\right)\right] \label{eq:16-3-5}\end{equation}

16.1 の $\eqref{eq:16-1-13}$ より

\begin{equation}\frac{\partial f}{\partial z} = \frac{1}{2}\left(\frac{\partial f}{\partial x} - i\frac{\partial f}{\partial y}\right) \label{eq:16-3-6}\end{equation}

\begin{equation}\frac{\partial f^*}{\partial z} = \frac{1}{2}\left(\frac{\partial f^*}{\partial x} - i\frac{\partial f^*}{\partial y}\right) \label{eq:16-3-7}\end{equation}

$\eqref{eq:16-3-6}$ と $\eqref{eq:16-3-7}$ を $\eqref{eq:16-3-5}$ に代入する。

\begin{equation}\frac{\partial h}{\partial z} = \frac{\partial g}{\partial f}\frac{\partial f}{\partial z} + \frac{\partial g}{\partial f^*}\frac{\partial f^*}{\partial z} \label{eq:16-3-8}\end{equation}

同様に、$h$ の $z^*$ についてのWirtinger微分を計算する。16.1 の $\eqref{eq:16-1-14}$ より

\begin{equation}\frac{\partial h}{\partial z^*} = \frac{1}{2}\left(\frac{\partial h}{\partial x} + i\frac{\partial h}{\partial y}\right) \label{eq:16-3-9}\end{equation}

$\eqref{eq:16-3-3}$ と $\eqref{eq:16-3-4}$ を $\eqref{eq:16-3-9}$ に代入する。

\begin{equation}\frac{\partial h}{\partial z^*} = \frac{1}{2}\left[\frac{\partial g}{\partial f}\left(\frac{\partial f}{\partial x} + i\frac{\partial f}{\partial y}\right) + \frac{\partial g}{\partial f^*}\left(\frac{\partial f^*}{\partial x} + i\frac{\partial f^*}{\partial y}\right)\right] \label{eq:16-3-10}\end{equation}

16.1 の $\eqref{eq:16-1-14}$ より

\begin{equation}\frac{\partial f}{\partial z^*} = \frac{1}{2}\left(\frac{\partial f}{\partial x} + i\frac{\partial f}{\partial y}\right) \label{eq:16-3-11}\end{equation}

\begin{equation}\frac{\partial f^*}{\partial z^*} = \frac{1}{2}\left(\frac{\partial f^*}{\partial x} + i\frac{\partial f^*}{\partial y}\right) \label{eq:16-3-12}\end{equation}

$\eqref{eq:16-3-11}$ と $\eqref{eq:16-3-12}$ を $\eqref{eq:16-3-10}$ に代入する。

\begin{equation}\frac{\partial h}{\partial z^*} = \frac{\partial g}{\partial f}\frac{\partial f}{\partial z^*} + \frac{\partial g}{\partial f^*}\frac{\partial f^*}{\partial z^*} \label{eq:16-3-13}\end{equation}

補足:実数の連鎖律と異なり、$f$ と $f^*$ の両方を経由するパスを考慮する必要がある。$f$ が正則な場合は $\partial f/\partial z^* = 0$、$\partial f^*/\partial z = 0$ となり、通常の連鎖律に帰着する。

16.4 $\text{Tr}(\boldsymbol{X}^*)$ の微分

公式:$\displaystyle\frac{\partial \text{Tr}(\boldsymbol{X}^*)}{\partial \Re\boldsymbol{X}} = \boldsymbol{I}$, $\quad\displaystyle\frac{\partial \text{Tr}(\boldsymbol{X}^*)}{\partial \Im\boldsymbol{X}} = -i\boldsymbol{I}$
条件:$\boldsymbol{X} \in \mathbb{C}^{n \times n}$、$\boldsymbol{X}^* = \Re\boldsymbol{X} - i\Im\boldsymbol{X}$(要素ごとの複素共役)
証明

行列 $\boldsymbol{X}$ の成分を実部と虚部に分解する。

\begin{equation}X_{ij} = (\Re X)_{ij} + i(\Im X)_{ij} \label{eq:16-4-1}\end{equation}

複素共役は

\begin{equation}X_{ij}^* = (\Re X)_{ij} - i(\Im X)_{ij} \label{eq:16-4-2}\end{equation}

トレースの定義より

\begin{equation}\text{Tr}(\boldsymbol{X}^*) = \sum_{i=0}^{n-1} X_{ii}^* \label{eq:16-4-3}\end{equation}

$\eqref{eq:16-4-2}$ を $\eqref{eq:16-4-3}$ に代入する。

\begin{equation}\text{Tr}(\boldsymbol{X}^*) = \sum_{i=0}^{n-1} \left[(\Re X)_{ii} - i(\Im X)_{ii}\right] \label{eq:16-4-4}\end{equation}

$\eqref{eq:16-4-4}$ を実部で偏微分する。$(k, l)$ 成分について

\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X}^*)}{\partial (\Re X)_{kl}} = \frac{\partial}{\partial (\Re X)_{kl}} \sum_{i=0}^{n-1} (\Re X)_{ii} = \delta_{kl} \label{eq:16-4-5}\end{equation}

ここで $\delta_{kl}$ はKroneckerのデルタである。

$\eqref{eq:16-4-5}$ を行列形式で書く。

\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X}^*)}{\partial \Re\boldsymbol{X}} = \boldsymbol{I} \label{eq:16-4-6}\end{equation}

同様に、$\eqref{eq:16-4-4}$ を虚部で偏微分する。

\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X}^*)}{\partial (\Im X)_{kl}} = \frac{\partial}{\partial (\Im X)_{kl}} \sum_{i=0}^{n-1} (-i)(\Im X)_{ii} = -i\delta_{kl} \label{eq:16-4-7}\end{equation}

$\eqref{eq:16-4-7}$ を行列形式で書く。

\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X}^*)}{\partial \Im\boldsymbol{X}} = -i\boldsymbol{I} \label{eq:16-4-8}\end{equation}

$\eqref{eq:16-4-8}$ の両辺に $i$ を掛けると

\begin{equation}i \cdot \frac{\partial \text{Tr}(\boldsymbol{X}^*)}{\partial \Im\boldsymbol{X}} = i \cdot (-i)\boldsymbol{I} = \boldsymbol{I} \label{eq:16-4-9}\end{equation}

$\eqref{eq:16-4-6}$ と $\eqref{eq:16-4-9}$ より、実部と虚部の微分($i$ を掛けた後)が同じ符号 $\boldsymbol{I}$ を持つことがわかる。

補足:$\boldsymbol{X}^H = (\boldsymbol{X}^*)^\top$ より、$\text{Tr}(\boldsymbol{X}^H) = \text{Tr}(\boldsymbol{X}^*)$ なので同じ結果が成り立つ。

16.5 $\text{Tr}(\boldsymbol{X})$ の微分

公式:$\displaystyle\frac{\partial \text{Tr}(\boldsymbol{X})}{\partial \Re\boldsymbol{X}} = \boldsymbol{I}$, $\quad\displaystyle\frac{\partial \text{Tr}(\boldsymbol{X})}{\partial \Im\boldsymbol{X}} = i\boldsymbol{I}$
条件:$\boldsymbol{X} \in \mathbb{C}^{n \times n}$
証明

行列 $\boldsymbol{X}$ の成分を実部と虚部に分解する。

\begin{equation}X_{ij} = (\Re X)_{ij} + i(\Im X)_{ij} \label{eq:16-5-1}\end{equation}

トレースの定義より

\begin{equation}\text{Tr}(\boldsymbol{X}) = \sum_{i=0}^{n-1} X_{ii} \label{eq:16-5-2}\end{equation}

$\eqref{eq:16-5-1}$ を $\eqref{eq:16-5-2}$ に代入する。

\begin{equation}\text{Tr}(\boldsymbol{X}) = \sum_{i=0}^{n-1} \left[(\Re X)_{ii} + i(\Im X)_{ii}\right] \label{eq:16-5-3}\end{equation}

$\eqref{eq:16-5-3}$ を実部で偏微分する。$(k, l)$ 成分について

\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X})}{\partial (\Re X)_{kl}} = \frac{\partial}{\partial (\Re X)_{kl}} \sum_{i=0}^{n-1} (\Re X)_{ii} = \delta_{kl} \label{eq:16-5-4}\end{equation}

$\eqref{eq:16-5-4}$ を行列形式で書く。

\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X})}{\partial \Re\boldsymbol{X}} = \boldsymbol{I} \label{eq:16-5-5}\end{equation}

同様に、$\eqref{eq:16-5-3}$ を虚部で偏微分する。

\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X})}{\partial (\Im X)_{kl}} = \frac{\partial}{\partial (\Im X)_{kl}} \sum_{i=0}^{n-1} i(\Im X)_{ii} = i\delta_{kl} \label{eq:16-5-6}\end{equation}

$\eqref{eq:16-5-6}$ を行列形式で書く。

\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X})}{\partial \Im\boldsymbol{X}} = i\boldsymbol{I} \label{eq:16-5-7}\end{equation}

$\eqref{eq:16-5-7}$ の両辺に $i$ を掛けると

\begin{equation}i \cdot \frac{\partial \text{Tr}(\boldsymbol{X})}{\partial \Im\boldsymbol{X}} = i \cdot i\boldsymbol{I} = -\boldsymbol{I} \label{eq:16-5-8}\end{equation}

$\eqref{eq:16-5-5}$ と $\eqref{eq:16-5-8}$ を比較すると、実部と虚部の微分($i$ を掛けた後)は異なる符号を持つ。これは 16.4 の $\text{Tr}(\boldsymbol{X}^*)$ の場合と対照的である。

補足:$\text{Tr}(\boldsymbol{X}^*)$ と $\text{Tr}(\boldsymbol{X})$ の虚部微分の符号が異なることに注意。これは共役微分と一般化微分の使い分けに影響する。

16.6 $\text{Tr}(\boldsymbol{A}\boldsymbol{X}^H)$ の微分

公式:$\displaystyle\frac{\partial \text{Tr}(\boldsymbol{A}\boldsymbol{X}^H)}{\partial \Re\boldsymbol{X}} = \boldsymbol{A}$, $\quad i\displaystyle\frac{\partial \text{Tr}(\boldsymbol{A}\boldsymbol{X}^H)}{\partial \Im\boldsymbol{X}} = \boldsymbol{A}$
条件:$\boldsymbol{A}$ は定数行列、$\boldsymbol{X}^H = (\boldsymbol{X}^*)^\top$(Hermite転置)
証明

Hermite転置の定義より

\begin{equation}(\boldsymbol{X}^H)_{ij} = X_{ji}^* = (\Re X)_{ji} - i(\Im X)_{ji} \label{eq:16-6-1}\end{equation}

トレースを成分で展開する。

\begin{equation}\text{Tr}(\boldsymbol{A}\boldsymbol{X}^H) = \sum_{i,j} A_{ij} (\boldsymbol{X}^H)_{ji} = \sum_{i,j} A_{ij} X_{ij}^* \label{eq:16-6-2}\end{equation}

$\eqref{eq:16-6-1}$ の形式を用いて $\eqref{eq:16-6-2}$ を書き直す。

\begin{equation}\text{Tr}(\boldsymbol{A}\boldsymbol{X}^H) = \sum_{i,j} A_{ij} \left[(\Re X)_{ij} - i(\Im X)_{ij}\right] \label{eq:16-6-3}\end{equation}

$\eqref{eq:16-6-3}$ を実部で偏微分する。$(k, l)$ 成分について

\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{A}\boldsymbol{X}^H)}{\partial (\Re X)_{kl}} = \frac{\partial}{\partial (\Re X)_{kl}} \sum_{i,j} A_{ij} (\Re X)_{ij} = A_{kl} \label{eq:16-6-4}\end{equation}

$\eqref{eq:16-6-4}$ を行列形式で書く。

\begin{equation}\left(\frac{\partial \text{Tr}(\boldsymbol{A}\boldsymbol{X}^H)}{\partial \Re\boldsymbol{X}}\right)_{kl} = A_{kl} \label{eq:16-6-5}\end{equation}

$\eqref{eq:16-6-5}$ はそのまま行列 $\boldsymbol{A}$ の $(k,l)$ 成分であるから

\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{A}\boldsymbol{X}^H)}{\partial \Re\boldsymbol{X}} = \boldsymbol{A} \label{eq:16-6-6}\end{equation}

同様に、$\eqref{eq:16-6-3}$ を虚部で偏微分する。

\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{A}\boldsymbol{X}^H)}{\partial (\Im X)_{kl}} = \frac{\partial}{\partial (\Im X)_{kl}} \sum_{i,j} A_{ij} (-i)(\Im X)_{ij} = -iA_{kl} \label{eq:16-6-7}\end{equation}

$\eqref{eq:16-6-7}$ を行列形式で書く。

\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{A}\boldsymbol{X}^H)}{\partial \Im\boldsymbol{X}} = -i\boldsymbol{A} \label{eq:16-6-8}\end{equation}

$\eqref{eq:16-6-8}$ の両辺に $i$ を掛けると

\begin{equation}i \cdot \frac{\partial \text{Tr}(\boldsymbol{A}\boldsymbol{X}^H)}{\partial \Im\boldsymbol{X}} = i \cdot (-i)\boldsymbol{A} = \boldsymbol{A} \label{eq:16-6-9}\end{equation}

$\eqref{eq:16-6-6}$ と $\eqref{eq:16-6-9}$ より、実部と虚部の微分($i$ を掛けた後)は同じ結果 $\boldsymbol{A}$ となる。

補足:実部と虚部の微分($i$ を掛けた後)が同じ結果 $\boldsymbol{A}$ になる。注意:実行列の場合 $\partial\text{Tr}(\boldsymbol{A}\boldsymbol{X}^\top)/\partial\boldsymbol{X} = \boldsymbol{A}^\top$ では転置が現れるが、これは $X^\top$ と $X^H$ の構造の違いによる。$\text{Tr}(\boldsymbol{A}\boldsymbol{X}^H) = \sum_{ij} A_{ij} X^*_{ij}$ なので $\partial/\partial(\Re X)_{kl} = A_{kl}$ となり、結果は $\boldsymbol{A}$ である。

16.7 $\text{Tr}(\boldsymbol{A}\boldsymbol{X}^*)$ の微分

公式:$\displaystyle\frac{\partial \text{Tr}(\boldsymbol{A}\boldsymbol{X}^*)}{\partial \Re\boldsymbol{X}} = \boldsymbol{A}^\top$, $\quad i\displaystyle\frac{\partial \text{Tr}(\boldsymbol{A}\boldsymbol{X}^*)}{\partial \Im\boldsymbol{X}} = \boldsymbol{A}^\top$
条件:$\boldsymbol{A}$ は定数行列、$\boldsymbol{X}^*$(要素ごとの複素共役)
証明

トレースを成分で展開する。

\begin{equation}\text{Tr}(\boldsymbol{A}\boldsymbol{X}^*) = \sum_{i,j} A_{ij} (\boldsymbol{X}^*)_{ji} = \sum_{i,j} A_{ij} X_{ji}^* \label{eq:16-7-1}\end{equation}

複素共役を実部と虚部で書く。

\begin{equation}X_{ji}^* = (\Re X)_{ji} - i(\Im X)_{ji} \label{eq:16-7-2}\end{equation}

$\eqref{eq:16-7-2}$ を $\eqref{eq:16-7-1}$ に代入する。

\begin{equation}\text{Tr}(\boldsymbol{A}\boldsymbol{X}^*) = \sum_{i,j} A_{ij} \left[(\Re X)_{ji} - i(\Im X)_{ji}\right] \label{eq:16-7-3}\end{equation}

$\eqref{eq:16-7-3}$ を実部で偏微分する。$(k, l)$ 成分について

\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{A}\boldsymbol{X}^*)}{\partial (\Re X)_{kl}} = \frac{\partial}{\partial (\Re X)_{kl}} \sum_{i,j} A_{ij} (\Re X)_{ji} = A_{lk} \label{eq:16-7-4}\end{equation}

ここで、$(\Re X)_{ji}$ を $(\Re X)_{kl}$ で微分すると $\delta_{jk}\delta_{il}$ が得られ、これを代入すると $A_{lk}$ となる。

$\eqref{eq:16-7-4}$ を行列形式で書く。$(\boldsymbol{A}^\top)_{kl} = A_{lk}$ より

\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{A}\boldsymbol{X}^*)}{\partial \Re\boldsymbol{X}} = \boldsymbol{A}^\top \label{eq:16-7-5}\end{equation}

同様に、$\eqref{eq:16-7-3}$ を虚部で偏微分する。

\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{A}\boldsymbol{X}^*)}{\partial (\Im X)_{kl}} = \frac{\partial}{\partial (\Im X)_{kl}} \sum_{i,j} A_{ij} (-i)(\Im X)_{ji} = -iA_{lk} \label{eq:16-7-6}\end{equation}

$\eqref{eq:16-7-6}$ を行列形式で書く。

\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{A}\boldsymbol{X}^*)}{\partial \Im\boldsymbol{X}} = -i\boldsymbol{A}^\top \label{eq:16-7-7}\end{equation}

$\eqref{eq:16-7-7}$ の両辺に $i$ を掛けると

\begin{equation}i \cdot \frac{\partial \text{Tr}(\boldsymbol{A}\boldsymbol{X}^*)}{\partial \Im\boldsymbol{X}} = \boldsymbol{A}^\top \label{eq:16-7-8}\end{equation}

$\eqref{eq:16-7-5}$ と $\eqref{eq:16-7-8}$ より、16.6 と同じ結果が得られる。

補足:$\text{Tr}(\boldsymbol{A}\boldsymbol{X}^H)$ と同じ結果になる。これは $\text{Tr}(\boldsymbol{A}\boldsymbol{X}^*) = \text{Tr}(\boldsymbol{X}^*\boldsymbol{A}) = \text{Tr}((\boldsymbol{A}^\top\boldsymbol{X})^*)$ の関係から理解できる。

16.8 $\text{Tr}(\boldsymbol{X}\boldsymbol{X}^H)$ の微分

公式:$\displaystyle\frac{\partial \text{Tr}(\boldsymbol{X}\boldsymbol{X}^H)}{\partial \Re\boldsymbol{X}} = 2\Re\boldsymbol{X}$, $\quad\displaystyle\frac{\partial \text{Tr}(\boldsymbol{X}\boldsymbol{X}^H)}{\partial \Im\boldsymbol{X}} = 2\Im\boldsymbol{X}$
条件:$\boldsymbol{X} \in \mathbb{C}^{m \times n}$
証明

トレースの巡回性(1.12)より

\begin{equation}\text{Tr}(\boldsymbol{X}\boldsymbol{X}^H) = \text{Tr}(\boldsymbol{X}^H\boldsymbol{X}) \label{eq:16-8-1}\end{equation}

$\eqref{eq:16-8-1}$ を成分で展開する。

\begin{equation}\text{Tr}(\boldsymbol{X}\boldsymbol{X}^H) = \sum_{i,j} X_{ij} X_{ij}^* = \sum_{i,j} |X_{ij}|^2 \label{eq:16-8-2}\end{equation}

$\eqref{eq:16-8-2}$ はFrobeniusノルムの2乗である。

\begin{equation}\text{Tr}(\boldsymbol{X}\boldsymbol{X}^H) = \|\boldsymbol{X}\|_F^2 \label{eq:16-8-3}\end{equation}

複素数の絶対値の2乗を実部と虚部で書く。

\begin{equation}|X_{ij}|^2 = (\Re X_{ij})^2 + (\Im X_{ij})^2 \label{eq:16-8-4}\end{equation}

$\eqref{eq:16-8-4}$ を $\eqref{eq:16-8-2}$ に代入する。

\begin{equation}\text{Tr}(\boldsymbol{X}\boldsymbol{X}^H) = \sum_{i,j} \left[(\Re X_{ij})^2 + (\Im X_{ij})^2\right] \label{eq:16-8-5}\end{equation}

$\eqref{eq:16-8-5}$ を実部で偏微分する。$(k, l)$ 成分について

\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X}\boldsymbol{X}^H)}{\partial (\Re X)_{kl}} = \frac{\partial}{\partial (\Re X)_{kl}} \sum_{i,j} (\Re X_{ij})^2 = 2(\Re X)_{kl} \label{eq:16-8-6}\end{equation}

$\eqref{eq:16-8-6}$ を行列形式で書く。

\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X}\boldsymbol{X}^H)}{\partial \Re\boldsymbol{X}} = 2\Re\boldsymbol{X} \label{eq:16-8-7}\end{equation}

同様に、$\eqref{eq:16-8-5}$ を虚部で偏微分する。

\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X}\boldsymbol{X}^H)}{\partial (\Im X)_{kl}} = \frac{\partial}{\partial (\Im X)_{kl}} \sum_{i,j} (\Im X_{ij})^2 = 2(\Im X)_{kl} \label{eq:16-8-8}\end{equation}

$\eqref{eq:16-8-8}$ を行列形式で書く。

\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X}\boldsymbol{X}^H)}{\partial \Im\boldsymbol{X}} = 2\Im\boldsymbol{X} \label{eq:16-8-9}\end{equation}

補足:$\text{Tr}(\boldsymbol{X}\boldsymbol{X}^H) = \|\boldsymbol{X}\|_F^2$ はFrobeniusノルムの2乗である。この微分は行列の最小二乗問題で頻繁に使用される。

16.9 $\text{Tr}(\boldsymbol{X}\boldsymbol{X}^H)$ のWirtinger微分

公式:$\displaystyle\frac{\partial \text{Tr}(\boldsymbol{X}\boldsymbol{X}^H)}{\partial \boldsymbol{X}} = \boldsymbol{X}^*$, $\quad\displaystyle\frac{\partial \text{Tr}(\boldsymbol{X}\boldsymbol{X}^H)}{\partial \boldsymbol{X}^*} = \boldsymbol{X}$
条件:$\boldsymbol{X} \in \mathbb{C}^{m \times n}$
証明

16.1 の $\eqref{eq:16-1-13}$ をベクトルに拡張したWirtinger微分の定義を用いる。

\begin{equation}\frac{\partial f}{\partial \boldsymbol{X}} = \frac{1}{2}\left(\frac{\partial f}{\partial \Re\boldsymbol{X}} - i\frac{\partial f}{\partial \Im\boldsymbol{X}}\right) \label{eq:16-9-1}\end{equation}

16.8 の $\eqref{eq:16-8-7}$ と $\eqref{eq:16-8-9}$ より

\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X}\boldsymbol{X}^H)}{\partial \Re\boldsymbol{X}} = 2\Re\boldsymbol{X}, \quad \frac{\partial \text{Tr}(\boldsymbol{X}\boldsymbol{X}^H)}{\partial \Im\boldsymbol{X}} = 2\Im\boldsymbol{X} \label{eq:16-9-2}\end{equation}

$\eqref{eq:16-9-2}$ を $\eqref{eq:16-9-1}$ に代入する。

\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X}\boldsymbol{X}^H)}{\partial \boldsymbol{X}} = \frac{1}{2}\left(2\Re\boldsymbol{X} - i \cdot 2\Im\boldsymbol{X}\right) = \Re\boldsymbol{X} - i\Im\boldsymbol{X} \label{eq:16-9-3}\end{equation}

複素共役の定義より

\begin{equation}\boldsymbol{X}^* = \Re\boldsymbol{X} - i\Im\boldsymbol{X} \label{eq:16-9-4}\end{equation}

$\eqref{eq:16-9-3}$ と $\eqref{eq:16-9-4}$ より

\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X}\boldsymbol{X}^H)}{\partial \boldsymbol{X}} = \boldsymbol{X}^* \label{eq:16-9-5}\end{equation}

同様に、共役微分の定義(16.1 の $\eqref{eq:16-1-14}$)を用いる。

\begin{equation}\frac{\partial f}{\partial \boldsymbol{X}^*} = \frac{1}{2}\left(\frac{\partial f}{\partial \Re\boldsymbol{X}} + i\frac{\partial f}{\partial \Im\boldsymbol{X}}\right) \label{eq:16-9-6}\end{equation}

$\eqref{eq:16-9-2}$ を $\eqref{eq:16-9-6}$ に代入する。

\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X}\boldsymbol{X}^H)}{\partial \boldsymbol{X}^*} = \frac{1}{2}\left(2\Re\boldsymbol{X} + i \cdot 2\Im\boldsymbol{X}\right) = \Re\boldsymbol{X} + i\Im\boldsymbol{X} = \boldsymbol{X} \label{eq:16-9-7}\end{equation}

補足:Wirtinger微分により、複素行列関数の微分を実部・虚部に分解せずに直接表現できる。

16.10 Frobeniusノルムの複素勾配

公式:$\nabla\text{Tr}(\boldsymbol{X}\boldsymbol{X}^H) = \nabla\|\boldsymbol{X}\|_F^2 = 2\boldsymbol{X}$
条件:$\boldsymbol{X} \in \mathbb{C}^{m \times n}$
証明

$\text{Tr}(\boldsymbol{X}\boldsymbol{X}^H) = \|\boldsymbol{X}\|_F^2$ は実数値関数である。

\begin{equation}f = \text{Tr}(\boldsymbol{X}\boldsymbol{X}^H) \in \mathbb{R} \label{eq:16-10-1}\end{equation}

16.2 の $\eqref{eq:16-2-4}$ より、実数値関数の複素勾配は

\begin{equation}\nabla f = 2\frac{\partial f}{\partial \boldsymbol{X}^*} \label{eq:16-10-2}\end{equation}

16.9 の $\eqref{eq:16-9-7}$ より

\begin{equation}\frac{\partial \text{Tr}(\boldsymbol{X}\boldsymbol{X}^H)}{\partial \boldsymbol{X}^*} = \boldsymbol{X} \label{eq:16-10-3}\end{equation}

$\eqref{eq:16-10-3}$ を $\eqref{eq:16-10-2}$ に代入する。

\begin{equation}\nabla\text{Tr}(\boldsymbol{X}\boldsymbol{X}^H) = 2\boldsymbol{X} \label{eq:16-10-4}\end{equation}

$\eqref{eq:16-10-1}$ より、$\eqref{eq:16-10-4}$ はFrobeniusノルムの複素勾配を与える。

\begin{equation}\nabla\|\boldsymbol{X}\|_F^2 = 2\boldsymbol{X} \label{eq:16-10-5}\end{equation}

補足:Frobeniusノルム $\|\boldsymbol{X}\|_F^2$ の複素勾配が $2\boldsymbol{X}$ であることを示している。複素最適化問題(例:複素行列の低ランク近似)で頻繁に使われる。

16.11 $\det(\boldsymbol{X}^H\boldsymbol{A}\boldsymbol{X})$ の微分

公式:$\displaystyle\frac{\partial \det(\boldsymbol{X}^H\boldsymbol{A}\boldsymbol{X})}{\partial \boldsymbol{X}} = \det(\boldsymbol{X}^H\boldsymbol{A}\boldsymbol{X})\left((\boldsymbol{X}^H\boldsymbol{A}\boldsymbol{X})^{-1}\boldsymbol{X}^H\boldsymbol{A}\right)^\top$
$\displaystyle\frac{\partial \det(\boldsymbol{X}^H\boldsymbol{A}\boldsymbol{X})}{\partial \boldsymbol{X}^*} = \det(\boldsymbol{X}^H\boldsymbol{A}\boldsymbol{X})\boldsymbol{A}\boldsymbol{X}(\boldsymbol{X}^H\boldsymbol{A}\boldsymbol{X})^{-1}$
条件:$\boldsymbol{X} \in \mathbb{C}^{m \times n}$、$\boldsymbol{A}$ は定数行列、$\boldsymbol{X}^H\boldsymbol{A}\boldsymbol{X}$ は正則
証明

補助行列 $\boldsymbol{M}$ を定義する。

\begin{equation}\boldsymbol{M} = \boldsymbol{X}^H\boldsymbol{A}\boldsymbol{X} \label{eq:16-11-1}\end{equation}

行列式の微分公式より

\begin{equation}d(\det\boldsymbol{M}) = \det(\boldsymbol{M})\text{Tr}(\boldsymbol{M}^{-1}d\boldsymbol{M}) \label{eq:16-11-2}\end{equation}

$\eqref{eq:16-11-1}$ を微分する。積の微分法則(1.25)を適用する。

\begin{equation}d\boldsymbol{M} = d(\boldsymbol{X}^H)\boldsymbol{A}\boldsymbol{X} + \boldsymbol{X}^H\boldsymbol{A}(d\boldsymbol{X}) \label{eq:16-11-3}\end{equation}

$\eqref{eq:16-11-3}$ を $\eqref{eq:16-11-2}$ に代入する。

\begin{equation}\text{Tr}(\boldsymbol{M}^{-1}d\boldsymbol{M}) = \text{Tr}(\boldsymbol{M}^{-1}d\boldsymbol{X}^H\boldsymbol{A}\boldsymbol{X}) + \text{Tr}(\boldsymbol{M}^{-1}\boldsymbol{X}^H\boldsymbol{A}\,d\boldsymbol{X}) \label{eq:16-11-4}\end{equation}

トレースの巡回性(1.12)を $\eqref{eq:16-11-4}$ の第1項に適用する。

\begin{equation}\text{Tr}(\boldsymbol{M}^{-1}d\boldsymbol{X}^H\boldsymbol{A}\boldsymbol{X}) = \text{Tr}(\boldsymbol{A}\boldsymbol{X}\boldsymbol{M}^{-1}d\boldsymbol{X}^H) \label{eq:16-11-5}\end{equation}

$\eqref{eq:16-11-4}$ と $\eqref{eq:16-11-5}$ をまとめる。

\begin{equation}\text{Tr}(\boldsymbol{M}^{-1}d\boldsymbol{M}) = \text{Tr}(\boldsymbol{A}\boldsymbol{X}\boldsymbol{M}^{-1}d\boldsymbol{X}^H) + \text{Tr}(\boldsymbol{M}^{-1}\boldsymbol{X}^H\boldsymbol{A}\,d\boldsymbol{X}) \label{eq:16-11-6}\end{equation}

Wirtinger微分では、$d\boldsymbol{X}^H$ に対応する項が $\partial/\partial\boldsymbol{X}^*$ の係数を与え、$d\boldsymbol{X}$ に対応する項が $\partial/\partial\boldsymbol{X}$ の係数を与える。

$\eqref{eq:16-11-6}$ の第1項より、$\partial/\partial\boldsymbol{X}^*$ の微分を読み取る。$\text{Tr}(\boldsymbol{B}d\boldsymbol{X}^H) = \text{Tr}(d\boldsymbol{X}^H\boldsymbol{B})$ の係数行列は $\boldsymbol{B}^\top$ なので

\begin{equation}\frac{\partial \det\boldsymbol{M}}{\partial \boldsymbol{X}^*} = \det\boldsymbol{M} \cdot \boldsymbol{A}\boldsymbol{X}\boldsymbol{M}^{-1} \label{eq:16-11-7}\end{equation}

$\eqref{eq:16-11-6}$ の第2項より、$\partial/\partial\boldsymbol{X}$ の微分を読み取る。$\text{Tr}(\boldsymbol{C}d\boldsymbol{X})$ の係数行列は $\boldsymbol{C}^\top$ なので

\begin{equation}\frac{\partial \det\boldsymbol{M}}{\partial \boldsymbol{X}} = \det\boldsymbol{M} \cdot (\boldsymbol{M}^{-1}\boldsymbol{X}^H\boldsymbol{A})^\top \label{eq:16-11-8}\end{equation}

$\boldsymbol{M} = \boldsymbol{X}^H\boldsymbol{A}\boldsymbol{X}$ を代入して最終結果を得る。

補足:この公式は複素行列の固有値問題や、MIMO通信における容量最大化問題で使用される。

16.12 複素Rayleigh商の微分

公式:$\displaystyle\frac{\partial}{\partial \boldsymbol{x}}\displaystyle\frac{(\boldsymbol{A}\boldsymbol{x})^H(\boldsymbol{A}\boldsymbol{x})}{(\boldsymbol{B}\boldsymbol{x})^H(\boldsymbol{B}\boldsymbol{x})} = 2\displaystyle\frac{\boldsymbol{A}^H\boldsymbol{A}\boldsymbol{x}}{\boldsymbol{x}^H\boldsymbol{B}^H\boldsymbol{B}\boldsymbol{x}} - 2\displaystyle\frac{\boldsymbol{x}^H\boldsymbol{A}^H\boldsymbol{A}\boldsymbol{x} \cdot \boldsymbol{B}^H\boldsymbol{B}\boldsymbol{x}}{(\boldsymbol{x}^H\boldsymbol{B}^H\boldsymbol{B}\boldsymbol{x})^2}$
条件:$\boldsymbol{A}, \boldsymbol{B}$ はHermite行列、$\boldsymbol{B}$ は正定値、$\boldsymbol{x} \in \mathbb{C}^n$
証明

Rayleigh商 $R(\boldsymbol{x})$ を定義する。

\begin{equation}R(\boldsymbol{x}) = \frac{(\boldsymbol{A}\boldsymbol{x})^H(\boldsymbol{A}\boldsymbol{x})}{(\boldsymbol{B}\boldsymbol{x})^H(\boldsymbol{B}\boldsymbol{x})} = \frac{\boldsymbol{x}^H\boldsymbol{A}^H\boldsymbol{A}\boldsymbol{x}}{\boldsymbol{x}^H\boldsymbol{B}^H\boldsymbol{B}\boldsymbol{x}} \label{eq:16-12-1}\end{equation}

分子と分母を別々に定義する。

\begin{equation}f = \boldsymbol{x}^H\boldsymbol{A}^H\boldsymbol{A}\boldsymbol{x}, \quad g = \boldsymbol{x}^H\boldsymbol{B}^H\boldsymbol{B}\boldsymbol{x} \label{eq:16-12-2}\end{equation}

商の微分則(1.28)を適用する。

\begin{equation}\frac{\partial R}{\partial \boldsymbol{x}} = \frac{\partial}{\partial \boldsymbol{x}}\left(\frac{f}{g}\right) = \frac{1}{g}\frac{\partial f}{\partial \boldsymbol{x}} - \frac{f}{g^2}\frac{\partial g}{\partial \boldsymbol{x}} \label{eq:16-12-3}\end{equation}

Hermite二次形式 $\boldsymbol{x}^H\boldsymbol{M}\boldsymbol{x}$($\boldsymbol{M}$ はHermite行列)のWirtinger微分を計算する。$\boldsymbol{M} = \boldsymbol{A}^H\boldsymbol{A}$ とおく。

\begin{equation}\frac{\partial (\boldsymbol{x}^H\boldsymbol{M}\boldsymbol{x})}{\partial \boldsymbol{x}} = (\boldsymbol{M}\boldsymbol{x})^* \label{eq:16-12-4}\end{equation}

$\eqref{eq:16-12-4}$ を $f$ と $g$ に適用する。

\begin{equation}\frac{\partial f}{\partial \boldsymbol{x}} = (\boldsymbol{A}^H\boldsymbol{A}\boldsymbol{x})^* \label{eq:16-12-5}\end{equation}

\begin{equation}\frac{\partial g}{\partial \boldsymbol{x}} = (\boldsymbol{B}^H\boldsymbol{B}\boldsymbol{x})^* \label{eq:16-12-6}\end{equation}

複素勾配の定義 $\nabla R = 2\partial R/\partial \boldsymbol{x}^*$ を用いると、$\partial R/\partial \boldsymbol{x}$ は

\begin{equation}\frac{\partial R}{\partial \boldsymbol{x}} = \frac{1}{g}(\boldsymbol{A}^H\boldsymbol{A}\boldsymbol{x})^* - \frac{f}{g^2}(\boldsymbol{B}^H\boldsymbol{B}\boldsymbol{x})^* \label{eq:16-12-7}\end{equation}

複素勾配 $\nabla R = 2\partial R/\partial \boldsymbol{x}^*$ を計算する。実数値関数では $\partial R/\partial \boldsymbol{x}^* = (\partial R/\partial \boldsymbol{x})^*$ ではないことに注意し、直接計算すると

\begin{equation}\nabla R = 2\frac{\boldsymbol{A}^H\boldsymbol{A}\boldsymbol{x}}{\boldsymbol{x}^H\boldsymbol{B}^H\boldsymbol{B}\boldsymbol{x}} - 2\frac{\boldsymbol{x}^H\boldsymbol{A}^H\boldsymbol{A}\boldsymbol{x} \cdot \boldsymbol{B}^H\boldsymbol{B}\boldsymbol{x}}{(\boldsymbol{x}^H\boldsymbol{B}^H\boldsymbol{B}\boldsymbol{x})^2} \label{eq:16-12-8}\end{equation}

補足:この公式は一般化固有値問題の反復解法(パワー法の複素拡張)で使われる。$R(\boldsymbol{x})$ の停留点は一般化固有ベクトルに対応する。

16.13 複素二次形式 $(a - \boldsymbol{x}^H \boldsymbol{b})^2$ の微分

公式:$\displaystyle\frac{\partial (a - \boldsymbol{x}^H \boldsymbol{b})^2}{\partial \boldsymbol{x}} = -2\bar{\boldsymbol{b}}(a - \boldsymbol{x}^H \boldsymbol{b})^*$
条件:$\boldsymbol{x}, \boldsymbol{b} \in \mathbb{C}^n$、$a \in \mathbb{C}$
証明

補助変数 $z$ を定義する。

\begin{equation}z = a - \boldsymbol{x}^H \boldsymbol{b} = a - \sum_{i=0}^{n-1} \bar{x}_i b_i \label{eq:16-13-1}\end{equation}

スカラ関数 $f$ を定義する。

\begin{equation}f = z^2 = (a - \boldsymbol{x}^H \boldsymbol{b})^2 \label{eq:16-13-2}\end{equation}

Wirtinger微分では $\boldsymbol{x}$ と $\bar{\boldsymbol{x}}$ を独立変数として扱う。$\eqref{eq:16-13-1}$ より、$z$ は $\bar{x}_k$ に依存するが、$x_k$ には直接依存しない。

\begin{equation}\frac{\partial z}{\partial \bar{x}_k} = -b_k \label{eq:16-13-3}\end{equation}

\begin{equation}\frac{\partial z}{\partial x_k} = 0 \label{eq:16-13-4}\end{equation}

$f = z^2$ を連鎖律(1.26)で微分する。

\begin{equation}\frac{\partial f}{\partial \bar{x}_k} = \frac{\partial (z^2)}{\partial z} \cdot \frac{\partial z}{\partial \bar{x}_k} = 2z \cdot (-b_k) = -2b_k z \label{eq:16-13-5}\end{equation}

$\eqref{eq:16-13-5}$ をベクトル形式で書く。

\begin{equation}\frac{\partial f}{\partial \bar{\boldsymbol{x}}} = -2\boldsymbol{b}z \label{eq:16-13-6}\end{equation}

Wirtinger微分の標準的な関係式を用いる。

\begin{equation}\frac{\partial f}{\partial \boldsymbol{x}} = \overline{\frac{\partial f}{\partial \bar{\boldsymbol{x}}}} \label{eq:16-13-7}\end{equation}

$\eqref{eq:16-13-6}$ を $\eqref{eq:16-13-7}$ に代入する。

\begin{equation}\frac{\partial f}{\partial \boldsymbol{x}} = \overline{-2\boldsymbol{b}z} = -2\bar{\boldsymbol{b}} \bar{z} \label{eq:16-13-8}\end{equation}

$\bar{z} = z^*$ であるから

\begin{equation}\frac{\partial (a - \boldsymbol{x}^H \boldsymbol{b})^2}{\partial \boldsymbol{x}} = -2\bar{\boldsymbol{b}} (a - \boldsymbol{x}^H \boldsymbol{b})^* \label{eq:16-13-9}\end{equation}

補足:$\boldsymbol{b}$ が実ベクトルの場合は $\bar{\boldsymbol{b}} = \boldsymbol{b}$ となり、$-2\boldsymbol{b}(a - \boldsymbol{x}^H \boldsymbol{b})^*$ となる。

参考文献

  • Petersen, K. B., & Pedersen, M. S. (2012). The Matrix Cookbook. Technical University of Denmark.
  • Magnus, J. R., & Neudecker, H. (1999). Matrix Differential Calculus with Applications in Statistics and Econometrics (Revised ed.). Wiley.
  • Matrix calculus - Wikipedia