연속시간 마르코프 체인의 통일 원리 — Q-matrix에서 정상분포까지
CTMC의 infinitesimal generator Q-matrix부터 Kolmogorov 방정식, detailed balance, Birth-Death 과정까지 — 단 하나의 구조적 원리가 어떻게 모든 결과를 만들어내는지 추적한다.
- 01 확률과정을 정의한다는 것은 무엇인가
- 02 마르코프 체인의 네 가지 얼굴 — 전이행렬에서 에르고딕 정리까지
- 03 Poisson 과정은 왜 세 가지 얼굴을 가지는가
- 04 연속시간 마르코프 체인의 통일 원리 — Q-matrix에서 정상분포까지
- 05 마팅게일은 왜 현대 AI 이론의 언어인가
- 06 브라운 운동은 왜 이토 적분을 강제하는가
- 07 MCMC는 왜 복잡한 분포에서도 작동하는가
연속시간 마르코프 체인(CTMC)은 이산 MC의 시간 축을 실수선으로 확장한다. 그런데 이 확장은 단순한 일반화가 아니다 — “무한히 짧은 시간 동안 무슨 일이 일어나는가”라는 질문이 모든 구조를 결정한다. 그 답이 Q-matrix(생성기)이고, 이 하나의 행렬에서 전이확률의 시간 진화, 정상분포, 수렴 속도가 전부 나온다. 어떻게 그것이 가능한가?
infinitesimal 정보로 모든 것을 결정하다
CTMC의 전이확률 는 연속 시간의 함수다. 이 전체를 기술하는 대신, generator 는 초기 미분 정보만 담는다.
는 세 가지 성질을 만족한다: 비대각 원소 , 대각 , 그리고 행합 0 . 행합 0은 확률 보존의 직접적 표현이다 — 상태 에서 탈출하는 총 확률 흐름이 0이어야 한다.
는 상태 의 탈출률이다. 이 탈출률이 holding time의 분포를 결정한다. CTMC의 Markov 성질은 “미래가 현재에만 의존한다”는 것이고, “현재”에는 얼마나 오래 머물렀는지 정보가 없다. 따라서 holding time 분포는 age-free, 즉 메모리리스여야 한다. 메모리리스 연속 분포는 오직 지수분포뿐이다.
CTMC에서 상태 의 holding time은 반드시 를 따른다.
Markov 성질로부터 holding time 은 메모리리스다. 연속 분포에서 메모리리스 ⟺ 지수분포. Rate 결정: 가 의 생존함수와 일치한다.
이로써 CTMC는 두 가지로 완전히 분해된다 — jump chain (어느 상태로 뛸 것인가, 전이확률 ) 와 holding time (얼마나 머물 것인가, ). 그리고 하나가 두 정보를 모두 담는다.
유한 상태 CTMC에서 전이확률 행렬의 전체 시간 진화는 다음 행렬지수로 닫힌다.
“속도장”이 있으면 궤적이 결정된다는 ODE의 논리 — 가 CTMC의 속도장이다.
두 개의 방정식, 하나의 해
는 두 행렬 ODE를 동시에 만족한다.
두 방정식은 해석이 다르다. Forward는 “현재 분포에서 한 step 더 미래로” — 초기분포 의 시간 진화 로 이어진다. Backward는 “관찰 함수의 기댓값이 초기 조건에 따라 어떻게 변하는가” — 에 대해 를 만족한다.
그런데 왜 두 방정식의 해가 같은가? 는 자기 자신의 생성기와 교환하기 때문이다.
급수 의 각 항이 와 교환한다. 이 교환성이 “왼쪽에서 곱”과 “오른쪽에서 곱”을 동등하게 만든다. Markov semigroup의 특수성 — 같은 생성기에서 나온 들은 서로 교환한다.
가 시간에 따라 변하면 와 가 일반적으로 교환하지 않는다. 이때 이며 time-ordered exponential이 필요하다. Forward와 Backward 방정식의 해가 달라진다.
Forward 방정식의 고정점이 정상분포다. ⟺ , 따라서 (행벡터 는 의 left-null vector).
Detailed Balance — 정상분포의 충분조건
은 각 상태에서 “들어오는 확률 흐름 = 나가는 확률 흐름”의 global balance다. 이보다 강한 조건이 detailed balance다.
모든 쌍 에서 흐름이 균형이면, 합산해도 균형이다 — detailed balance ⟹ global balance ⟹ .
가 detailed balance를 만족한다 ⟺ 가 에서 self-adjoint이다.
. Detailed balance 를 대입하면 .
Self-adjoint는 실고유값과 직교 고유함수를 보장한다. Q의 고유값은 모두 (기약이면 0 제외 strict), 따라서 spectral gap 가 수렴 속도를 결정한다.
이산 MC의 수렴이 연속 버전에서 로 이어진다. 이 analogy는 우연이 아니다 — 의 극한으로, 이산의 와 연속의 가 대응한다.
Birth-Death — Detailed Balance의 자동 보장
Birth-Death 과정은 상태 에서 로만 이동하는 CTMC다.
1D nearest-neighbor 구조는 cycle이 없다. Cycle 없음 ⟹ detailed balance가 자동이다 — 정상분포가 존재하면 reversible임이 보장된다. 정상분포는 DB 조건 을 반복 적용해 닫힌 형태로 얻는다.
정상분포 존재 ⟺ 이 급수의 수렴이다. M/M/1의 경우 , 이면 (), 수렴 조건은 이다. M/M/c는 로, Erlang-C 분포가 나온다.
트레이드오프
이 프레임워크가 강력한 만큼 가정도 명확하다.
유한 탈출률 가정: 가 필요하다. 무한 탈출률이 허용되면 유한 시간 안에 무한 번 jump하는 explosion 문제가 생긴다. 가산 무한 상태공간에서는 의 수렴 여부가 정상분포 존재를 결정하며, 이는 유한 상태에서 자명한 것과 다르다.
이산 상태 한계: 연속 상태 공간으로 가면 는 행렬이 아닌 미분 연산자가 된다. Forward 방정식은 Fokker-Planck PDE, Backward는 Kolmogorov Backward PDE로 이어진다. CTMC는 이 연속 세계의 이산 전조다 — SDE의 drift/diffusion은 CTMC generator의 연속 버전이다.
시간 동질성 한계: 가 시간 변화하면 교환성이 무너지고 행렬지수 계산이 복잡해진다. Score-based diffusion model의 VP-SDE (가 시간 변화)가 정확히 이 경우다.
계산 비용: 행렬지수는 . 상태 공간이 크면 () Krylov subspace 근사가 필요하다.
정리
- Q-matrix는 CTMC의 infinitesimal dynamics를 완전히 encoding한다. 가 holding time의 rate이고, 가 jump chain의 전이확률이다.
- Forward 방정식 는 분포 진화, Backward 는 기댓값 진화를 기술한다. 유한 상태에서 해는 로 통일된다.
- Detailed balance 는 reversibility와 동치이며, 가 $\