固有値と固有ベクトルの基礎
このページの目標
固有値と固有ベクトルの概念を理解し、その幾何学的意味を把握する。「なぜ固有値が重要なのか」という動機から出発し、定義、計算方法、固有空間までを解説する。性質と応用は第7章で扱う。
1. なぜ固有値・固有ベクトルが重要なのか
行列の「本質」を知りたい
行列 $A$ は線形変換を表すが、$A$ が与えられたとき、その変換の「本質」は何だろうか?
例えば、次の行列を考える:
$$A = \begin{pmatrix} 0.88 & -0.18 \\ -0.32 & 1.02 \end{pmatrix}$$この行列は、ベクトル
$$\boldsymbol{v} = (x,y)^\top$$をどのように変換するだろうか? $\boldsymbol{v}$ が $A$ によって
$$\boldsymbol{v}' = A \boldsymbol{v}$$へ移されるとして、その移動前後の点を矢印で結んでみよう。
図1:行列 $\boldsymbol{A}$ による変換(各点 $\boldsymbol{v}$ から $\boldsymbol{v}' = \boldsymbol{A}\boldsymbol{v}$ への矢印)
図から見える「特別な方向」
図1を見ると、場所によって多くの矢印は向きを変えているが、 斜め45°の直線上に並んだ矢印は原点に向かってまっすぐに縮んでいることに気づく。 また、メッシュが粗くてはっきりとは分からないものの、斜め120°の直線に近い矢印は、原点から遠ざかっているようである。 これら2つの直線上のベクトルは、変換を受けても向きが変わらず伸縮するだけ らしい。
そのようなベクトルは、伸縮率を $\lambda$ として次のように表せるだろう :
$$A\boldsymbol{v} = \lambda \boldsymbol{v}$$$\lambda > 1$ なら伸び、$0 < \lambda < 1$ なら縮む。
この例の場合、45°と120°のふたつの方向があったので
$$A\boldsymbol{v}_1 = \lambda_1 \boldsymbol{v}_1$$ $$A\boldsymbol{v}_2 = \lambda_2 \boldsymbol{v}_2$$の 2 組 $\{\boldsymbol{v}_1, \lambda_1\}$ と $\{\boldsymbol{v}_2, \lambda_2\}$ があるはずだが、それは行列 $A$ からどうやって求めたらいいのだろうか? 以下、この問いを一歩ずつ解き明かしてゆく。
2. 特別な方向に名前をつける ── 固有値と固有ベクトルの定義
第1節で見つけた「方向が変わらないベクトル」と「その方向の伸縮率」に、正式な名前を与えよう。
2.1 定義
定義:$A$ を $n \times n$ 行列とする。
スカラー $\lambda$ が $A$ の固有値(eigenvalue)であるとは、ある非零ベクトル $\boldsymbol{v} \neq \boldsymbol{0}$ が存在して
$$A\boldsymbol{v} = \lambda \boldsymbol{v}$$
を満たすことをいう。このとき $\boldsymbol{v}$ を $\lambda$ に対応する固有ベクトル(eigenvector)という。
2.2 語源
「eigen」はドイツ語で「固有の、特有の」という意味。固有ベクトルは、その行列に「固有の」方向を表している。
2.3 注意点
- 固有ベクトルは零ベクトルでないことが条件。$\boldsymbol{v} = \boldsymbol{0}$ は常に $A\boldsymbol{0} = \lambda\boldsymbol{0}$ を満たすが、固有ベクトルとは呼ばない。
- 固有ベクトル $\boldsymbol{v}$ に対して、任意の非零スカラー $c$ について $c\boldsymbol{v}$ も同じ固有値の固有ベクトルである($A(c\boldsymbol{v}) = cA\boldsymbol{v} = c\lambda\boldsymbol{v} = \lambda(c\boldsymbol{v})$)。したがって、固有ベクトルは一意には定まらず、方向だけが意味を持つ。
3. 図の観察を裏づける ── 幾何学的意味
定義が得られたところで、第1節の図で観察した現象を改めて理解しよう。
3.1 方向が変わらないベクトル
固有ベクトルの幾何学的意味:行列 $A$ による線形変換のもとで、固有ベクトル $\boldsymbol{v}$ は方向が変わらず、$\lambda$ 倍だけ伸縮する。
3.2 固有値の符号と大きさ
- $\lambda > 1$:固有ベクトル方向に伸びる
- $0 < \lambda < 1$:固有ベクトル方向に縮む
- $\lambda < 0$:固有ベクトル方向に反転(かつ $|\lambda|$ 倍)
- $\lambda = 1$:固有ベクトル方向は不変
- $\lambda = 0$:固有ベクトル方向は潰れる(原点に写る)
第1節の図1では、120°方向の矢印が原点から遠ざかり($\lambda > 1$ で伸びる)、45°方向の矢印が原点に近づいていた($0 < \lambda < 1$ で縮む)。これはまさに上記の分類と一致する。
3.3 どんな行列にも固有ベクトルがあるのか? ── 回転行列
2次元の回転行列($\theta \neq 0, \pi$ の場合):
$$R_\theta = \begin{pmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{pmatrix}$$この行列には実数の固有値がない。なぜなら、回転変換では($\theta \neq 0, \pi$ なら)どのベクトルも方向が変わるからである。
ただし、複素数まで考えると固有値 $e^{\pm i\theta}$ が存在する。このように、実数の範囲では固有ベクトルが存在しない行列もある。では、与えられた行列の固有値・固有ベクトルを系統的に求めるにはどうすればよいだろうか。
4. $\lambda$ と $\boldsymbol{v}$ を求める ── 特性方程式
幾何学的な意味はわかった。では、与えられた行列から固有値・固有ベクトルを実際に計算するにはどうすればよいか。
4.1 特性方程式
$A\boldsymbol{v} = \lambda\boldsymbol{v}$ を変形すると
$$(A - \lambda I)\boldsymbol{v} = \boldsymbol{0}$$だが、$A - \lambda I$ が正則なら、両辺に逆行列をかけて
$$\boldsymbol{v} = (A - \lambda I)^{-1}\boldsymbol{0} = \boldsymbol{0}$$となり $\boldsymbol{v} = \boldsymbol{0}$ になってしまう。しかし定義から $\boldsymbol{v} \neq \boldsymbol{0}$ でなければならないので、 $(A - \lambda I)$ は正則であってはならない、つまり $A$ の行列式が 0 である必要がある。
特性方程式
$$\det(A - \lambda I) = 0$$この方程式を特性方程式という。左辺の $\det(A - \lambda I)$ を展開すると $\lambda$ の多項式になるので、これを特性多項式という($n \times n$ 行列なら $\lambda$ の $n$ 次式)。
4.2 具体例
$A = \begin{pmatrix} 3 & 1 \\ 0 & 2 \end{pmatrix}$ の固有値を求める。
$$A - \lambda I = \begin{pmatrix} 3-\lambda & 1 \\ 0 & 2-\lambda \end{pmatrix}$$ $$\det(A - \lambda I) = (3-\lambda)(2-\lambda) - 0 = (3-\lambda)(2-\lambda)$$$\det(A - \lambda I) = 0$ より、$\lambda = 2$ または $\lambda = 3$。
4.3 固有ベクトルの計算
$\lambda = 2$ のとき:
$$(A - 2I)\boldsymbol{v} = \begin{pmatrix} 1 & 1 \\ 0 & 0 \end{pmatrix}\boldsymbol{v} = \boldsymbol{0}$$$x + y = 0$ より、固有ベクトルは $\boldsymbol{v} = t\begin{pmatrix} 1 \\ -1 \end{pmatrix}$($t \neq 0$)。
$\lambda = 3$ のとき:
$$(A - 3I)\boldsymbol{v} = \begin{pmatrix} 0 & 1 \\ 0 & -1 \end{pmatrix}\boldsymbol{v} = \boldsymbol{0}$$$y = 0$ より、固有ベクトルは $\boldsymbol{v} = t\begin{pmatrix} 1 \\ 0 \end{pmatrix}$($t \neq 0$)。
以下の図2は、この2つの固有ベクトル方向(破線)上の点と、それ以外の点に対して $\boldsymbol{v} \to A\boldsymbol{v}$ の変位を描いたものである(見やすさのため、矢印の長さは実際の 0.2 倍に縮小してある)。 固有ベクトル方向の矢印(色つき)は破線上に留まり、方向が変わらないことが確認できる。 一方、それ以外の矢印(灰色)は方向が変わっている。
図2:$A = \begin{pmatrix} 3 & 1 \\ 0 & 2 \end{pmatrix}$ の固有ベクトル方向(矢印の長さは実際の 0.2 倍)
4.4 第1節の行列の固有値を求める
特性方程式を使って、第1節の行列 $A = \begin{pmatrix} 0.88 & -0.18 \\ -0.32 & 1.02 \end{pmatrix}$ の固有値を求めてみよう。
$$\det(A - \lambda I) = (0.88 - \lambda)(1.02 - \lambda) - (-0.18)(-0.32)$$ $$= \lambda^2 - 1.90\lambda + 0.8976 - 0.0576 = \lambda^2 - 1.90\lambda + 0.84$$解の公式より:
$$\lambda = \dfrac{1.90 \pm \sqrt{1.90^2 - 4 \times 0.84}}{2} = \dfrac{1.90 \pm \sqrt{0.25}}{2} = \dfrac{1.90 \pm 0.50}{2}$$したがって $\lambda_1 = 1.2$、$\lambda_2 = 0.7$ である。続けて固有ベクトルも求めよう。
$\lambda_1 = 1.2$ のとき:
$$A - 1.2I = \begin{pmatrix} -0.32 & -0.18 \\ -0.32 & -0.18 \end{pmatrix}$$$-0.32x - 0.18y = 0$ より $x = -\dfrac{9}{16}y$ なので、固有ベクトルは $\boldsymbol{v}_1 = t\begin{pmatrix} -9 \\ 16 \end{pmatrix}$($t \neq 0$)。 方向角は $\arctan\!\left(\dfrac{16}{-9}\right) \approx 120°$ である。
$\lambda_2 = 0.7$ のとき:
$$A - 0.7I = \begin{pmatrix} 0.18 & -0.18 \\ -0.32 & 0.32 \end{pmatrix}$$$0.18x - 0.18y = 0$ より $x = y$ なので、固有ベクトルは $\boldsymbol{v}_2 = t\begin{pmatrix} 1 \\ 1 \end{pmatrix}$($t \neq 0$)。 方向角は $\arctan\!\left(\dfrac{1}{1}\right) = 45°$ である。
$\lambda_1 = 1.2 > 1$ なので 120°方向は伸び、$0 < \lambda_2 = 0.7 < 1$ なので 45°方向は縮む ── 固有値・固有ベクトルの計算結果が、第1節の図1で観察した現象と完全に一致した。
図3:第1節の行列の固有ベクトル方向($\lambda = 1.2$ の方向は伸び、$\lambda = 0.7$ の方向は縮む)
5. 固有ベクトルの広がり ── 固有空間
第4節で、行列 $A = \begin{pmatrix} 3 & 1 \\ 0 & 2 \end{pmatrix}$ の固有値 $\lambda = 2$ に属する固有ベクトルとして $\boldsymbol{v} = t\begin{pmatrix} 1 \\ -1 \end{pmatrix}$($t \neq 0$)を得た。 $t = 1$ でも $t = -3$ でも $t = 0.5$ でも固有ベクトルである。 第2節で見たように、固有ベクトルの定数倍はやはり固有ベクトルだからである。
つまり固有ベクトルは一つではなく、$\begin{pmatrix} 1 \\ -1 \end{pmatrix}$ 方向の直線全体(原点を除く)が固有ベクトルになっている。 ここで便宜上、原点 $\boldsymbol{0}$ も含めた集合を考えると、これはちょうど原点を通る直線 ── すなわち $\mathbb{R}^2$ の1次元部分空間になる。
「空間」というと2次元の平面や3次元の立体をイメージしがちだが、線形代数では原点を通る直線(1次元)も立派な部分空間である。 加法とスカラー倍で閉じていれば、次元にかかわらず「空間」と呼ぶ。 この集合に名前をつけよう。
5.1 定義
定義:固有値 $\lambda$ に対応する固有空間 $E_\lambda$ は:
$$E_\lambda = \{\boldsymbol{v} \in \mathbb{R}^n \mid A\boldsymbol{v} = \lambda\boldsymbol{v}\}$$
すなわち、「$A\boldsymbol{v} = \lambda\boldsymbol{v}$ を満たすベクトル $\boldsymbol{v}$ の全体」であり、零ベクトルも含む。 $A\boldsymbol{v} = \lambda\boldsymbol{v}$ は $(A - \lambda I)\boldsymbol{v} = \boldsymbol{0}$ と同じなので、固有空間とは $(A - \lambda I)\boldsymbol{v} = \boldsymbol{0}$ の解空間のことである。 この解空間を $\ker(A - \lambda I)$ と書き、核(kernel)と呼ぶ:
$$E_\lambda = \ker(A - \lambda I)$$先ほどの例では、$E_2 = \left\{ t\begin{pmatrix} 1 \\ -1 \end{pmatrix} \;\middle|\; t \in \mathbb{R} \right\}$ であり、これは1次元の部分空間(直線)である。 同様に $E_3 = \left\{ t\begin{pmatrix} 1 \\ 0 \end{pmatrix} \;\middle|\; t \in \mathbb{R} \right\}$ も1次元の部分空間である。
5.2 固有空間の次元
上の例では固有空間はどちらも1次元(直線)だった。しかし一般には、一つの固有値に対して独立な固有ベクトルが複数存在し、固有空間が2次元以上(平面やそれ以上)になることもある。
固有空間の次元を幾何学的重複度という。一方、固有値が特性多項式の根として何重に現れるかを代数的重複度という。 常に「幾何学的重複度 $\leq$ 代数的重複度」が成り立つ。
5.3 固有空間は何の役に立つのか?
「固有値が伸縮率、固有ベクトルがその方向を教えてくれるなら、固有空間は要らないのでは?」と思うかもしれない。 固有ベクトル1本では足りない場面があるのだ。
固有値 $\lambda$ の重複度が2以上のとき、対応する固有ベクトルは1本ではなく、面や空間全体に広がり得る。例として3次元の対角行列を考えよう:
$$A = \begin{pmatrix} 3 & 0 & 0 \\ 0 & 3 & 0 \\ 0 & 0 & 1 \end{pmatrix}$$固有値 $\lambda = 3$ に属する固有ベクトルは $\begin{pmatrix}1\\0\\0\end{pmatrix}$ だけではない。$\begin{pmatrix}0\\1\\0\end{pmatrix}$ も固有ベクトルであり、さらにこの2本の任意の線形結合 $s\begin{pmatrix}1\\0\\0\end{pmatrix} + t\begin{pmatrix}0\\1\\0\end{pmatrix}$ もすべて固有ベクトルである。 すなわち固有空間 $E_3$ は $xy$ 平面全体(2次元)であり、この平面上のあらゆる方向が一様に3倍に引き伸ばされる。
「固有ベクトルは $\begin{pmatrix}1\\0\\0\end{pmatrix}$」と1本だけ挙げても、平面全体が3倍に伸びるという情報が抜け落ちてしまう。 固有空間を知ることで初めて、同じ倍率で伸縮する方向の全貌が把握できるのだ。
対角化の可否を決めるもの
固有空間の次元は、行列が対角化できるか否かを決定する。
- すべての固有値で「幾何学的重複度 $=$ 代数的重複度」 → 対角化できる
- どれか一つでも「幾何学的重複度 $\lt$ 代数的重複度」 → 対角化できない
例えば次の行列は固有値 $\lambda = 3$(代数的重複度2)をもつが、固有空間は1次元しかない:
$$B = \begin{pmatrix} 3 & 1 \\ 0 & 3 \end{pmatrix}$$$(B - 3I)\boldsymbol{v} = \boldsymbol{0}$ を解くと $\boldsymbol{v} = t\begin{pmatrix}1\\0\end{pmatrix}$ のみ。独立な固有ベクトルが2本揃わないため、$B$ は対角化できない。 この「固有空間の広がりが足りない」ことが、行列の構造的な複雑さ(Jordan標準形が必要になること)を教えてくれる。
まとめ:固有ベクトル1本は「方向」を、固有値は「倍率」を教える。固有空間はその倍率で伸縮する全方向の広がりを教える。重複固有値があるとき、この広がりの次元が行列の本質的な構造を決定する。
6. 注意点
6.1 固有ベクトルは一意でない
固有ベクトルの任意の非零定数倍もまた固有ベクトルである。比較のために、通常はノルム1に正規化して用いる。
6.2 重複固有値に注意
固有値が重複する場合、対応する固有ベクトルの個数(幾何的重複度)が代数的重複度より小さいことがある。この場合、行列は対角化できない。
6.3 数値計算の安定性
大規模行列の固有値計算は数値的に不安定な場合がある。実用上は QR 法やべき乗法などの反復法が用いられる。
6.4 一般化固有値問題
$A\boldsymbol{v} = \lambda B\boldsymbol{v}$ の形の一般化固有値問題も重要であり、有限要素法などの工学的応用で現れる。
7. まとめと次のステップ
第1節の問い ──「行列の本質とは何か?」── に対する基本的な答えが得られた。行列の作用は、固有ベクトルの方向への伸縮として理解でき、固有値がその伸縮率を与える。
本ページのポイント
- 固有値・固有ベクトル:$A\boldsymbol{v} = \lambda\boldsymbol{v}$ を満たす $\lambda$ と $\boldsymbol{v}$
- 幾何学的意味:変換で方向が変わらないベクトル
- 計算方法:特性方程式 $\det(A - \lambda I) = 0$ を解く
- 固有空間:$E_\lambda = \ker(A - \lambda I)$(固有ベクトルと零ベクトルの集合)
次章:固有値の性質と応用
固有値はトレースや行列式と深い関係をもち、その性質を証明付きで理解することで応用への道が開ける。第7章では、固有値の4つの重要な性質を証明し、行列の冪乗や微分方程式、主成分分析など具体的な応用を解説する。
付録:行列による画像変換を体験する
行列 $A$ の各要素を自由に変えて、画像がどのように変形されるかを観察してみよう。出力画像の各ピクセル位置 $\boldsymbol{v}'$ に対して $\boldsymbol{v} = A^{-1}\boldsymbol{v}'$ で元画像の座標を計算し、その色を描画している。
| 1.00 | 0.00 |
| 0.00 | 1.00 |
図4:行列 $A$ による画像変換(スライダで自由に変更可能)