カタラン数

Catalan Numbers

初級

1. 概要

カタラン数(Catalan numbers)は、組合せ論において最も頻繁に現れる数列の一つである。括弧の正しい対応付け、二分木の構造、凸多角形の三角形分割など、一見無関係に思える多くの組合せ的問題が、すべて同じ数列で数え上げられるという驚くべき普遍性を持つ。

この数列の歴史は 18 世紀に遡る。1751 年、Leonhard Euler は凸多角形を対角線で三角形に分割する方法の数を考え、Johann Andreas von Segner との書簡のなかでこの問題を議論した。Segner は 1758 年にこの数列の再帰的な公式を導いた。その後 1838 年、ベルギーの数学者 Eugène Charles Catalan がこの数列を体系的に研究し、現在の名称の由来となった。

カタラン数は次の閉じた公式で定義される:

$$ C_n = \frac{1}{n+1}\binom{2n}{n} $$

この単純な式が、200 以上もの異なる組合せ的対象を数え上げるという事実は、組合せ論の深い構造を反映している。

2. 定義

定義(カタラン数)

非負整数 $n \ge 0$ に対して、第 $n$ カタラン数 $C_n$ を次で定義する:

$$ C_n = \frac{1}{n+1}\binom{2n}{n} = \frac{(2n)!}{(n+1)!\,n!} $$

最初のいくつかの値を計算してみよう:

$n$ 012345678
$C_n$ 112514421324291430

計算例

$C_4$ を計算する:

$$ C_4 = \frac{1}{5}\binom{8}{4} = \frac{1}{5} \cdot \frac{8!}{4!\,4!} = \frac{1}{5} \cdot 70 = 14 $$

別の等価な表現として、次の形もよく使われる:

$$ C_n = \binom{2n}{n} - \binom{2n}{n+1} $$

この式は、後述する反射原理による証明から自然に導かれる。

3. 再帰公式

定理(カタラン数の再帰関係)

カタラン数は次の再帰式を満たす:

$$ C_{n+1} = \sum_{i=0}^{n} C_i \, C_{n-i}, \qquad C_0 = 1 $$

証明

$C_{n+1}$ が $n+1$ 組の括弧からなる正しい括弧列の数であることを用いて示す。

$n+1$ 組の括弧列の先頭は必ず開き括弧 "(" である。この最初の "(" に対応する閉じ括弧 ")" の位置で場合分けする。

括弧列全体を $w_1 w_2 \cdots w_{2(n+1)}$ とおく。$w_1 = \text{"("}$ であり、これに対応する閉じ括弧が $w_{2i+2}$ の位置にあるとする($0 \le i \le n$)。このとき括弧列は次の構造を持つ:

$$ \underbrace{(\;\overbrace{u_1 u_2 \cdots u_{2i}}^{i \text{ 組の括弧列}}\;)}_{\text{最初の括弧対とその内側}}\;\underbrace{v_1 v_2 \cdots v_{2(n-i)}}_{{(n-i) \text{ 組の括弧列}}} $$

ここで:

  • 内側の $u_1 \cdots u_{2i}$ は $i$ 組の正しい括弧列でなければならない。その数は $C_i$ 通り。
  • 外側(右側)の $v_1 \cdots v_{2(n-i)}$ は $n - i$ 組の正しい括弧列でなければならない。その数は $C_{n-i}$ 通り。

全単射性の確認:任意の $n+1$ 組の正しい括弧列に対して、最初の "(" の対応する ")" の位置は一意に定まる。逆に、$i$ を固定し、$i$ 組の正しい括弧列 $\alpha$ と $n-i$ 組の正しい括弧列 $\beta$ を選べば、$(\alpha)\beta$ は $n+1$ 組の正しい括弧列を与え、最初の "(" の対応する ")" は位置 $2i+2$ にある。この対応は明らかに一対一かつ全射である。

したがって、$i$ の各値に対する括弧列の数は $C_i \cdot C_{n-i}$ であり、$i = 0, 1, \ldots, n$ にわたって合計すると

$$ C_{n+1} = \sum_{i=0}^{n} C_i \, C_{n-i} $$

が得られる。$\square$

この再帰式を具体的に確かめてみよう:

  • $C_1 = C_0 \cdot C_0 = 1$
  • $C_2 = C_0 C_1 + C_1 C_0 = 1 + 1 = 2$
  • $C_3 = C_0 C_2 + C_1 C_1 + C_2 C_0 = 2 + 1 + 2 = 5$
  • $C_4 = C_0 C_3 + C_1 C_2 + C_2 C_1 + C_3 C_0 = 5 + 2 + 2 + 5 = 14$

また、閉じた形の再帰式として次も有用である:

$$ C_{n+1} = \frac{2(2n+1)}{n+2}\, C_n $$

これは閉じた公式から直接導かれ、逐次的な計算に便利である。

4. 母関数

定理(カタラン数の母関数)

カタラン数の通常母関数 $\displaystyle C(x) = \sum_{n=0}^{\infty} C_n x^n$ は次で与えられる:

$$ C(x) = \frac{1 - \sqrt{1 - 4x}}{2x} $$

収束半径は $|x| \le \frac{1}{4}$ である。

導出

再帰式 $\displaystyle C_{n+1} = \sum_{i=0}^{n} C_i C_{n-i}$ の両辺に $x^{n+1}$ を掛けて $n = 0, 1, 2, \ldots$ で和をとる。右辺は畳み込み(Cauchy 積)の形をしているから:

$$ C(x) - 1 = x \cdot C(x)^2 $$

すなわち、$C(x)$ は2次方程式

$$ x \, C(x)^2 - C(x) + 1 = 0 $$

を満たす。二次方程式の解の公式より

$$ C(x) = \frac{1 \pm \sqrt{1 - 4x}}{2x} $$

$C(0) = C_0 = 1$ を満たすのは負号の方($x \to 0$ で L'Hôpital の規則を適用すると確認できる)なので

$$ C(x) = \frac{1 - \sqrt{1 - 4x}}{2x} $$

を得る。

母関数の観点から、閉じた公式を再導出することもできる。$\sqrt{1-4x}$ の展開

$$ \sqrt{1-4x} = \sum_{n=0}^{\infty} \binom{1/2}{n} (-4x)^n $$

を用いて $C(x)$ の $x^n$ の係数を取り出すと $\displaystyle C_n = \frac{1}{n+1}\binom{2n}{n}$ が復元される。

5. 組合せ的解釈

カタラン数の最も注目すべき性質は、多様な組合せ的対象を統一的に数え上げることである。以下に代表的な 6 つの解釈を挙げる。

5.1 括弧の正しい対応付け

問題

$n$ 組の括弧を正しく対応させる方法は何通りあるか?

$C_n$ は $n$ 組の開き括弧 "(" と閉じ括弧 ")" からなる正しい括弧列の数に等しい。

$n = 3$: $C_3 = 5$ 通り

((()))(()())(())()()(())()()()

5.2 二分木の数

問題

$n + 1$ 枚の葉(外部節点)を持つ順序付き二分木は何通りあるか?

$C_n$ は $n$ 個の内部節点(= $n+1$ 枚の葉)を持つ相異なる順序付き完全二分木の数に等しい。

これは再帰構造から理解できる。根の左部分木に $i$ 個の内部節点、右部分木に $n - 1 - i$ 個の内部節点を割り当てると、合計は

$$ \sum_{i=0}^{n-1} C_i \, C_{n-1-i} = C_n $$

となり、再帰式と一致する。

$n = 3$: $C_3 = 5$ 通りの二分木

3 個の内部節点を持つ順序付き完全二分木は 5 通りあり、これは括弧列と一対一に対応する。

n=3の5通りの順序付き完全二分木
図1: $n=3$ の 5 通りの順序付き完全二分木(青丸: 内部節点、白丸: 葉)

5.3 凸多角形の三角形分割

問題

凸 $(n+2)$ 角形を対角線で三角形に分割する方法は何通りあるか?

$C_n$ は凸 $(n+2)$ 角形の三角形分割の数に等しい。これは Euler が最初に考えた問題であり、カタラン数の歴史的な起源でもある。

  • $n = 1$:三角形(3 角形)は分割不要。$C_1 = 1$
  • $n = 2$:四角形の対角線分割は $C_2 = 2$ 通り
  • $n = 3$:五角形の三角形分割は $C_3 = 5$ 通り
  • $n = 4$:六角形の三角形分割は $C_4 = 14$ 通り
n=3(五角形)の5通りの三角形分割 12 34 5 12 34 5 12 34 5 12 34 5 12 34 5
図2: 正五角形($n=3$)の $C_3 = 5$ 通りの三角形分割(青破線が対角線)

一辺を固定して、その辺を含む三角形の選び方で再帰的に数えると、カタラン数の再帰式が導かれる。

5.4 格子路(Dyck 路)

問題

$(0, 0)$ から $(n, n)$ への格子路で、対角線 $y = x$ を越えない(すなわち常に $y \le x$ の)ものは何通りあるか?

$C_n$ は $(0, 0)$ から $(n, n)$ への単調格子路(右または上への移動のみ)のうち、対角線 $y = x$ より上に出ないものの数に等しい。

同等の定式化として、Dyck 路($2n$ ステップの格子路で、上昇 "U" と下降 "D" からなり、途中で $y$ 座標が負にならないもの)の数としても表現できる。

$n = 3$: $C_3 = 5$ 通りの Dyck 路

UUUDDDUUDUDDUUDDUDUDUDUDUDUUDD

n=3のDyck路5通り UUUDDD UUDUDD UUDDUD UDUDUD UDUUDD
図3: $n=3$ の 5 通りの Dyck 路(青線がパス、破線が $y=0$ の地面)

5.5 非交差分割

問題

集合 $\{1, 2, \ldots, n\}$ の非交差分割は何通りあるか?

$C_n$ は $\{1, 2, \ldots, n\}$ の非交差分割(noncrossing partition)の数に等しい。非交差分割とは、$1, 2, \ldots, n$ を円周上に配置したとき、各ブロックの凸包が互いに交差しない分割のことである。

$n = 3$: $C_3 = 5$ 通り

$\{1, 2, 3\}$ の非交差分割:

  • $\{\{1\}, \{2\}, \{3\}\}$
  • $\{\{1, 2\}, \{3\}\}$
  • $\{\{1\}, \{2, 3\}\}$
  • $\{\{1, 3\}, \{2\}\}$
  • $\{\{1, 2, 3\}\}$
非交差分割と交差分割の対比 1 2 3 4 非交差 1 2 3 4 交差
図4: 非交差分割と交差分割の対比($n=4$。左: $\{1,2\},\{3,4\}$ は交差しない。右: $\{1,3\},\{2,4\}$ は交差する)

(注:$\{1, 3\}$ と $\{2\}$ は円周上で交差しないので許される。一方、仮に 4 要素で $\{1, 3\}$ と $\{2, 4\}$ は交差するので非交差分割には含まれない。)

5.6 山の列(Mountain ranges)

$2n$ 個のステップからなる山の列(上昇 "/" と下降 "\" を交互に行い、地面より下に行かない経路)の数は $C_n$ に等しい。これは Dyck 路と本質的に同じ対象であるが、視覚的には山脈のように見える。

6. 反射原理による証明

カタラン数の閉じた公式 $\displaystyle C_n = \frac{1}{n+1}\binom{2n}{n}$ を、反射原理(reflection principle, André の反射法)を用いて証明する。これは格子路の解釈を用いた最もエレガントな証明の一つである。

定理

$(0, 0)$ から $(n, n)$ への単調格子路のうち、対角線 $y = x$ を厳密に越えないものの数は

$$ C_n = \binom{2n}{n} - \binom{2n}{n+1} = \frac{1}{n+1}\binom{2n}{n} $$

証明

$(0, 0)$ から $(n, n)$ への単調格子路の総数は $\displaystyle\binom{2n}{n}$ である($2n$ ステップのうち右方向に進む $n$ ステップを選ぶ)。

ここから「悪い路」(対角線を越える路)の数を引けばよい。「悪い路」とは、ある点で初めて直線 $y = x + 1$ に触れる路である。

反射の議論:悪い路が初めて直線 $y = x + 1$ に触れる点を $P$ とする。$P$ 以降の経路を直線 $y = x + 1$ に関して反射する(右ステップと上ステップを入れ替える)。すると、悪い路は $(0, 0)$ から $(-1, n+1)$、すなわち座標を読み替えると $(n-1, n+1)$ への単調格子路と一対一に対応する。

反射原理の図解 0 1 2 3 4 0 1 2 3 4 5 y=x y=x+1 (0,0) P (4,4) (3,5) 良い路 悪い路 反射後
図5: 反射原理の図解($n=4$)。悪い路(青)が初めて $y=x+1$ に触れる点 $P$ で反射し、終点が $(4,4)$ から $(3,5)$ に変わる

$(0, 0)$ から $(n-1, n+1)$ への単調格子路の数は $\displaystyle\binom{2n}{n+1}$ である。

この対応は全単射なので、良い路の数は

$$ C_n = \binom{2n}{n} - \binom{2n}{n+1} $$

これを整理すると

$$ C_n = \binom{2n}{n} - \binom{2n}{n+1} = \binom{2n}{n}\left(1 - \frac{n}{n+1}\right) = \frac{1}{n+1}\binom{2n}{n} $$

が得られる。$\square$

この証明は投票問題(Ballot problem)とも深く関連している。候補者 $A$ が $a$ 票、候補者 $B$ が $b$ 票を獲得し $a > b$ のとき、開票の全過程で $A$ が常にリードしている確率は $\displaystyle\frac{a - b}{a + b}$ である。$a = b = n$ の場合、$A$ が常に $B$ 以上(同点を許す)であるような開票順序の数が $C_n$ に対応する。

7. 漸近公式

定理(カタラン数の漸近評価)

$n \to \infty$ のとき

$$ C_n \sim \frac{4^n}{n^{3/2}\sqrt{\pi}} $$

導出

Stirling の近似 $\displaystyle n! \sim \sqrt{2\pi n} \left(\frac{n}{e}\right)^n$ を用いる。

$$ \binom{2n}{n} = \frac{(2n)!}{(n!)^2} \sim \frac{\sqrt{4\pi n}\left(\frac{2n}{e}\right)^{2n}}{2\pi n \left(\frac{n}{e}\right)^{2n}} = \frac{4^n}{\sqrt{\pi n}} $$

したがって

$$ C_n = \frac{1}{n+1}\binom{2n}{n} \sim \frac{1}{n} \cdot \frac{4^n}{\sqrt{\pi n}} = \frac{4^n}{n^{3/2}\sqrt{\pi}} $$

この結果は、カタラン数が $4^n$ のオーダーで指数的に増大し、多項式因子 $n^{-3/2}$ で補正されることを示している。具体的な近似精度を確認してみよう:

$n$ $C_n$(厳密値) $\displaystyle\frac{4^n}{n^{3/2}\sqrt{\pi}}$(近似値) 相対誤差
54245.68.6%
1016796177345.6%
20656412042067487723542.8%
50$1.978 \times 10^{28}$$2.000 \times 10^{28}$1.1%

$n$ が大きくなるにつれて近似精度が向上していくことが分かる。

参考文献

  • Stanley, R. P. (2015). Catalan Numbers. Cambridge University Press.
  • Stanley, R. P. (2012). Enumerative Combinatorics, Vol. 2, Exercise 6.19. Cambridge University Press.
  • Graham, R. L., Knuth, D. E., & Patashnik, O. (1994). Concrete Mathematics (2nd ed.). Addison-Wesley.