コンピュータビジョン 入門
画像とカメラの基礎
入門の概要
入門では、コンピュータビジョンを学ぶための基礎を扱う。デジタル画像の構造、カメラの数学的モデル、座標変換の基礎を理解する。
学習目標
- デジタル画像の構造と色空間を理解する
- ピンホールカメラモデルを理解する
- 同次座標と変換行列を使いこなす
- 3Dから2Dへの射影を理解する
目次
-
第1章
デジタル画像の基礎
ピクセル、解像度、ビット深度
-
第2章
色空間
RGB、HSV、YUV、色の変換
-
第3章
ピンホールカメラモデル
焦点距離、画角、透視投影
-
第4章
同次座標と変換行列
平行移動、回転、スケーリングの統一表現
-
第5章
カメラ行列
内部パラメータ、外部パラメータ
-
第6章
練習問題
入門編の総まとめ
前提知識
- 線形代数の基礎(行列、ベクトル)
- 高校数学(三角関数)
基本概念
ピンホールカメラモデル
3D点$(X, Y, Z)$から画像座標$(u, v)$への射影:
$$\begin{pmatrix} u \\ v \\ 1 \end{pmatrix} \sim K \begin{pmatrix} X \\ Y \\ Z \end{pmatrix}, \quad K = \begin{pmatrix} f_x & 0 & c_x \\ 0 & f_y & c_y \\ 0 & 0 & 1 \end{pmatrix}$$同次座標
2D点$(x, y)$を$(x, y, 1)$で、3D点$(X, Y, Z)$を$(X, Y, Z, 1)$で表す。
これにより平行移動も行列の積で表現できる。
カメラ行列
$$P = K[R | t]$$$K$:内部パラメータ、$R$:回転行列、$t$:並進ベクトル