コンピュータビジョン

Computer Vision

このシリーズについて

コンピュータビジョンは、画像や動画から3D情報やシーンの理解を得るための学問分野である。本シリーズでは、カメラの数学的モデルから始めて、特徴点検出、ステレオビジョン、Structure from Motion、そしてSLAMやNeRFまで段階的に学習する。

コンピュータビジョンは自動運転、AR/VR、ロボティクス、医療画像など幅広い分野で活用されている。

レベル別学習

学習の流れ

入門 カメラの基礎 初級 特徴点・キャリブ 中級 3D再構成 上級 SLAM・NeRF 入門:画像、カメラモデル、座標変換、射影 初級:特徴点、マッチング、RANSAC、キャリブレーション 中級:エピポーラ幾何、ステレオ、SfM、MVS 上級:VO、SLAM、深層学習、NeRF、3DGS 2D画像から3D世界へ 2D画像 ピクセル座標 $(u, v)$ 特徴点 マッチング 複数視点 エピポーラ幾何 三角測量 3D復元 3Dモデル 点群・メッシュ $(X, Y, Z)$

主な学習内容

カメラ幾何学

ピンホールモデル、射影変換、内部・外部パラメータ。

特徴点検出

Harris、SIFT、ORBなど、画像から特徴的な点を検出する手法。

3D再構成

ステレオビジョン、SfM、MVSによる3D形状復元。

SLAM

自己位置推定と環境地図構築を同時に行う技術。

関連分野