IQ Lab
← all posts
AI 2026.04.28 · 13 min read Advanced

연속시간 마르코프 체인의 통일 원리 — Q-matrix에서 정상분포까지

CTMC의 infinitesimal generator Q-matrix부터 Kolmogorov 방정식, detailed balance, Birth-Death 과정까지 — 단 하나의 구조적 원리가 어떻게 모든 결과를 만들어내는지 추적한다.


연속시간 마르코프 체인(CTMC)은 이산 MC의 시간 축을 실수선으로 확장한다. 그런데 이 확장은 단순한 일반화가 아니다 — “무한히 짧은 시간 동안 무슨 일이 일어나는가”라는 질문이 모든 구조를 결정한다. 그 답이 Q-matrix(생성기)이고, 이 하나의 행렬에서 전이확률의 시간 진화, 정상분포, 수렴 속도가 전부 나온다. 어떻게 그것이 가능한가?

infinitesimal 정보로 모든 것을 결정하다

CTMC의 전이확률 P(t)=(Pij(t))P(t) = (P_{ij}(t))는 연속 시간의 함수다. 이 전체를 기술하는 대신, generator QQ초기 미분 정보만 담는다.

Qij:=limh0+Pij(h)δijhQ_{ij} := \lim_{h \to 0^+} \frac{P_{ij}(h) - \delta_{ij}}{h}

QQ는 세 가지 성질을 만족한다: 비대각 원소 qij0q_{ij} \geq 0, 대각 qii0q_{ii} \leq 0, 그리고 행합 0 jqij=0\sum_j q_{ij} = 0. 행합 0은 확률 보존의 직접적 표현이다 — 상태 ii에서 탈출하는 총 확률 흐름이 0이어야 한다.

qi:=qiiq_i := -q_{ii}는 상태 ii탈출률이다. 이 탈출률이 holding time의 분포를 결정한다. CTMC의 Markov 성질은 “미래가 현재에만 의존한다”는 것이고, “현재”에는 얼마나 오래 머물렀는지 정보가 없다. 따라서 holding time 분포는 age-free, 즉 메모리리스여야 한다. 메모리리스 연속 분포는 오직 지수분포뿐이다.

정리 1 · Holding time의 필연성

CTMC에서 상태 ii의 holding time은 반드시 Exp(qi)\text{Exp}(q_i)를 따른다.

▷ 증명

Markov 성질로부터 holding time T1T_1은 메모리리스다. 연속 분포에서 메모리리스 ⟺ 지수분포. Rate 결정: P(T1>h)=Pii(h)=1qih+o(h)\mathbb{P}(T_1 > h) = P_{ii}(h) = 1 - q_i h + o(h)Exp(qi)\text{Exp}(q_i)의 생존함수와 일치한다. \square

이로써 CTMC는 두 가지로 완전히 분해된다 — jump chain (어느 상태로 뛸 것인가, 전이확률 qij/qiq_{ij}/q_i) 와 holding time (얼마나 머물 것인가, Exp(qi)\text{Exp}(q_i)). 그리고 QQ 하나가 두 정보를 모두 담는다.

유한 상태 CTMC에서 전이확률 행렬의 전체 시간 진화는 다음 행렬지수로 닫힌다.

P(t)=etQ:=n0(tQ)nn!P(t) = e^{tQ} := \sum_{n \geq 0} \frac{(tQ)^n}{n!}

“속도장”이 있으면 궤적이 결정된다는 ODE의 논리 — QQ가 CTMC의 속도장이다.

두 개의 방정식, 하나의 해

P(t)=etQP(t) = e^{tQ}는 두 행렬 ODE를 동시에 만족한다.

P(t)=P(t)Q(Forward),P(t)=QP(t)(Backward)P'(t) = P(t)Q \quad \text{(Forward)}, \qquad P'(t) = QP(t) \quad \text{(Backward)}

두 방정식은 해석이 다르다. Forward는 “현재 분포에서 한 step 더 미래로” — 초기분포 μ0\mu_0의 시간 진화 μ˙t=μtQ\dot{\mu}_t = \mu_t Q로 이어진다. Backward는 “관찰 함수의 기댓값이 초기 조건에 따라 어떻게 변하는가” — u(t,i):=Ei[f(Xt)]u(t,i) := \mathbb{E}_i[f(X_t)]에 대해 u˙=Qu\dot{u} = Qu를 만족한다.

그런데 왜 두 방정식의 해가 같은가? etQe^{tQ}는 자기 자신의 생성기와 교환하기 때문이다.

etQQ=QetQe^{tQ} \cdot Q = Q \cdot e^{tQ}

급수 (tQ)n/n!\sum (tQ)^n/n!의 각 항이 QQ와 교환한다. 이 교환성이 “왼쪽에서 QQ 곱”과 “오른쪽에서 QQ 곱”을 동등하게 만든다. Markov semigroup의 특수성 — 같은 생성기에서 나온 P(t)P(t)들은 서로 교환한다.

비동질 CTMC에서의 한계

Q(t)Q(t)가 시간에 따라 변하면 Q(s)Q(s)Q(t)Q(t)가 일반적으로 교환하지 않는다. 이때 P(t)exp(0tQ(s)ds)P(t) \neq \exp(\int_0^t Q(s)ds)이며 time-ordered exponential이 필요하다. Forward와 Backward 방정식의 해가 달라진다.

Forward 방정식의 고정점이 정상분포다. μ˙t=0\dot{\mu}_t = 0μtQ=0\mu_t Q = 0, 따라서 πQ=0\pi Q = 0 (행벡터 π\piQQ의 left-null vector).

Detailed Balance — 정상분포의 충분조건

πQ=0\pi Q = 0은 각 상태에서 “들어오는 확률 흐름 = 나가는 확률 흐름”의 global balance다. 이보다 강한 조건이 detailed balance다.

πiqij=πjqjiij\pi_i q_{ij} = \pi_j q_{ji} \quad \forall i \neq j

모든 쌍 (i,j)(i,j)에서 흐름이 균형이면, 합산해도 균형이다 — detailed balance ⟹ global balance ⟹ πQ=0\pi Q = 0.

정리 2 · Reversibility와 Self-adjoint

(π,Q)(\pi, Q)가 detailed balance를 만족한다 ⟺ QQ2(π)\ell^2(\pi)에서 self-adjoint이다.

▷ 증명

Qf,gπ=i,jπiqijf(j)g(i)\langle Qf, g\rangle_\pi = \sum_{i,j} \pi_i q_{ij} f(j) g(i). Detailed balance πiqij=πjqji\pi_i q_{ij} = \pi_j q_{ji}를 대입하면 =i,jπjqjif(j)g(i)=f,Qgπ= \sum_{i,j} \pi_j q_{ji} f(j) g(i) = \langle f, Qg\rangle_\pi. \square

Self-adjoint는 실고유값과 직교 고유함수를 보장한다. Q의 고유값은 모두 0\leq 0 (기약이면 0 제외 strict), 따라서 spectral gap γ=minλ0λ\gamma = \min_{\lambda \neq 0} |\lambda|가 수렴 속도를 결정한다.

μtπTVCeγt\|\mu_t - \pi\|_{TV} \leq C e^{-\gamma t}

이산 MC의 λ2n|\lambda_2|^n 수렴이 연속 버전에서 eγte^{-\gamma t}로 이어진다. 이 analogy는 우연이 아니다 — Q=(PI)/hQ = (P - I)/h의 극한으로, 이산의 λ2\lambda_2와 연속의 γ=logλ2/h\gamma = -\log|\lambda_2|/h가 대응한다.

Birth-Death — Detailed Balance의 자동 보장

Birth-Death 과정은 상태 {0,1,2,}\{0,1,2,\ldots\}에서 nn±1n \leftrightarrow n \pm 1로만 이동하는 CTMC다.

Qn,n+1=λn,Qn,n1=μn,Qnn=(λn+μn)Q_{n,n+1} = \lambda_n, \quad Q_{n,n-1} = \mu_n, \quad Q_{nn} = -(\lambda_n + \mu_n)

1D nearest-neighbor 구조는 cycle이 없다. Cycle 없음 ⟹ detailed balance가 자동이다 — 정상분포가 존재하면 reversible임이 보장된다. 정상분포는 DB 조건 πnλn=πn+1μn+1\pi_n \lambda_n = \pi_{n+1} \mu_{n+1}을 반복 적용해 닫힌 형태로 얻는다.

πn=π0k=1nλk1μk,π0=(1+n1k=1nλk1μk)1\pi_n = \pi_0 \prod_{k=1}^n \frac{\lambda_{k-1}}{\mu_k}, \quad \pi_0 = \left(1 + \sum_{n \geq 1} \prod_{k=1}^n \frac{\lambda_{k-1}}{\mu_k}\right)^{-1}

정상분포 존재 ⟺ 이 급수의 수렴이다. M/M/1의 경우 λn=λ\lambda_n = \lambda, μn=μ\mu_n = \mu이면 πn=(1ρ)ρn\pi_n = (1-\rho)\rho^n (ρ=λ/μ\rho = \lambda/\mu), 수렴 조건은 ρ<1\rho < 1이다. M/M/c는 μn=min(n,c)μ\mu_n = \min(n,c)\mu로, Erlang-C 분포가 나온다.

트레이드오프

이 프레임워크가 강력한 만큼 가정도 명확하다.

유한 탈출률 가정: qi<q_i < \infty가 필요하다. 무한 탈출률이 허용되면 유한 시간 안에 무한 번 jump하는 explosion 문제가 생긴다. 가산 무한 상태공간에서는 λ/μ\sum \prod \lambda/\mu의 수렴 여부가 정상분포 존재를 결정하며, 이는 유한 상태에서 자명한 것과 다르다.

이산 상태 한계: 연속 상태 공간으로 가면 QQ는 행렬이 아닌 미분 연산자가 된다. Forward 방정식은 Fokker-Planck PDE, Backward는 Kolmogorov Backward PDE로 이어진다. CTMC는 이 연속 세계의 이산 전조다 — SDE의 drift/diffusion은 CTMC generator의 연속 버전이다.

시간 동질성 한계: Q(t)Q(t)가 시간 변화하면 교환성이 무너지고 행렬지수 계산이 복잡해진다. Score-based diffusion model의 VP-SDE (β(t)\beta(t)가 시간 변화)가 정확히 이 경우다.

계산 비용: N×NN \times N 행렬지수는 O(N3)O(N^3). 상태 공간이 크면 (N106N \sim 10^6) Krylov subspace 근사가 필요하다.

정리

  • Q-matrix는 CTMC의 infinitesimal dynamics를 완전히 encoding한다. qiq_i가 holding time의 Exp\text{Exp} rate이고, qij/qiq_{ij}/q_i가 jump chain의 전이확률이다.
  • Forward 방정식 μ˙=μQ\dot{\mu} = \mu Q는 분포 진화, Backward u˙=Qu\dot{u} = Qu는 기댓값 진화를 기술한다. 유한 상태에서 해는 P(t)=etQP(t) = e^{tQ}로 통일된다.
  • Detailed balance πiqij=πjqji\pi_i q_{ij} = \pi_j q_{ji}는 reversibility와 동치이며, QQ가 $\