機械学習 中級

Deep Learning Foundations — 中級(大学 3-4 年レベル)

この章について

中級では、ニューラルネットワークと深層学習の基礎を学ぶ。多層パーセプトロンから始め、画像認識の CNN、系列データの RNN へと進む。誤差逆伝播、最適化アルゴリズム、正則化技法を理解し、深層学習の「なぜ動くのか」を把握することが目標である。

前提知識

  • 初級レベルの内容(古典的 ML 手法)
  • 線形代数(行列演算、固有値)
  • 微分(連鎖律、勾配)
  • 確率論の基礎

目次

1. ニューラルネットワーク入門

深層学習の基本構造。

  • パーセプトロン
  • 多層パーセプトロン(MLP)
  • 活性化関数

2. 誤差逆伝播法

勾配計算のアルゴリズム。

  • 連鎖律の適用
  • 計算グラフ
  • 勾配消失問題

3. 最適化アルゴリズム

勾配降下の改良。

  • SGD とミニバッチ
  • Momentum, RMSprop
  • Adam

4. 正則化技法

過学習を防ぐ。

  • Dropout
  • Batch Normalization
  • データ拡張

5. 畳み込みニューラルネットワーク

画像認識の基盤。

  • 畳み込み層
  • プーリング層
  • CNN アーキテクチャ

6. CNN の発展

代表的なアーキテクチャ。

  • LeNet, AlexNet, VGG
  • ResNet(残差接続)
  • 転移学習

7. 再帰型ニューラルネットワーク

系列データの処理。

  • RNN の構造
  • BPTT
  • 長期依存性の問題

8. LSTM と GRU

ゲート機構による改良。

  • LSTM セル
  • GRU
  • 双方向 RNN

9. 埋め込みと表現学習

離散データの扱い。

  • One-hot エンコーディング
  • Word2Vec
  • 埋め込み層

10. 深層学習フレームワーク

実装の実践。

  • PyTorch / TensorFlow
  • 自動微分
  • GPU 活用

11. 次元削減

高次元データの可視化と圧縮。

  • PCA、カーネル PCA
  • t-SNE、UMAP
  • 因子分析

12. ハイパーパラメータ最適化

モデル調整の体系的手法。

  • グリッド・ランダムサーチ
  • ベイズ最適化、Optuna
  • Hyperband

13. 時系列予測

時間方向のデータ解析。

  • ARIMA、SARIMA
  • Prophet、状態空間モデル
  • Transformer ベース手法

主要な概念・手法

多層パーセプトロン

層 $l$ の出力:$\boldsymbol{h}^{(l)} = \sigma(\boldsymbol{W}^{(l)} \boldsymbol{h}^{(l-1)} + \boldsymbol{b}^{(l)})$
非線形活性化関数 $\sigma$ により、複雑な関数を表現。

誤差逆伝播法

損失 $L$ のパラメータ $\boldsymbol{W}^{(l)}$ に対する勾配を、連鎖律を用いて出力層から入力層へ逆向きに計算: $$\dfrac{\partial L}{\partial \boldsymbol{W}^{(l)}} = \dfrac{\partial L}{\partial \boldsymbol{h}^{(l)}} \dfrac{\partial \boldsymbol{h}^{(l)}}{\partial \boldsymbol{W}^{(l)}}$$

畳み込み演算

入力 $\boldsymbol{X}$ とフィルタ $\boldsymbol{K}$ の畳み込み: $(\boldsymbol{X} * \boldsymbol{K})_{i,j} = \displaystyle\sum_{m,n} X_{i+m, j+n} K_{m,n}$
局所的パターンを検出し、平行移動不変性を獲得。

残差接続(ResNet)

$\boldsymbol{y} = F(\boldsymbol{x}) + \boldsymbol{x}$(スキップ接続)。恒等写像を学習しやすくし、非常に深いネットワークの訓練を可能に。

LSTM

ゲート機構(入力・忘却・出力ゲート)により、長期の依存関係を学習。セル状態 $\boldsymbol{c}_t$ が情報を保持・更新。

このレベルで理解できる応用

画像分類

CNN による画像認識。ImageNet で学習済みモデルを転移学習で活用。

物体検出

YOLO, Faster R-CNN などのアーキテクチャ。バウンディングボックスの予測。

感情分析

LSTM/GRU によるテキスト分類。レビューからポジティブ/ネガティブを判定。

時系列予測

RNN による株価、需要、センサーデータの予測。

学習のポイント

  • 順伝播と逆伝播:手計算で小さな例を追う
  • 勾配の流れ:なぜ深いネットで学習が難しいか理解
  • アーキテクチャ設計:タスクに応じた構造を選ぶ
  • 実装と実験:コードを書き、ハイパーパラメータを調整する経験