コンピュータビジョン 入門

画像とカメラの基礎

入門の概要

画像の基礎 ピクセル、色空間 RGB, HSV, グレースケール カメラモデル ピンホールカメラ 焦点距離、画角 座標変換 同次座標 回転・並進・スケール 射影変換 3D → 2D 投影 透視投影

入門では、コンピュータビジョンを学ぶための基礎を扱う。デジタル画像の構造、カメラの数学的モデル、座標変換の基礎を理解する。

学習目標

  • デジタル画像の構造と色空間を理解する
  • ピンホールカメラモデルを理解する
  • 同次座標と変換行列を使いこなす
  • 3Dから2Dへの射影を理解する

目次

  1. 第1章 デジタル画像の基礎

    ピクセル、解像度、ビット深度

  2. 第2章 色空間

    RGB、HSV、YUV、色の変換

  3. 第3章 ピンホールカメラモデル

    焦点距離、画角、透視投影

  4. 第4章 同次座標と変換行列

    平行移動、回転、スケーリングの統一表現

  5. 第5章 カメラ行列

    内部パラメータ、外部パラメータ

  6. 第6章 練習問題

    入門編の総まとめ

前提知識

  • 線形代数の基礎(行列、ベクトル)
  • 高校数学(三角関数)

基本概念

ピンホールカメラモデル

3D点$(X, Y, Z)$から画像座標$(u, v)$への射影:

$$\begin{pmatrix} u \\ v \\ 1 \end{pmatrix} \sim K \begin{pmatrix} X \\ Y \\ Z \end{pmatrix}, \quad K = \begin{pmatrix} f_x & 0 & c_x \\ 0 & f_y & c_y \\ 0 & 0 & 1 \end{pmatrix}$$

同次座標

2D点$(x, y)$を$(x, y, 1)$で、3D点$(X, Y, Z)$を$(X, Y, Z, 1)$で表す。

これにより平行移動も行列の積で表現できる。

カメラ行列

$$P = K[R | t]$$

$K$:内部パラメータ、$R$:回転行列、$t$:並進ベクトル