Poisson 과정은 왜 세 가지 얼굴을 가지는가
카운트·간격·infinitesimal이라는 세 정의의 동치성부터 복합 Poisson의 특성함수, Little의 법칙을 통한 LLM inference 용량 설계까지, Poisson 과정의 통일된 구조를 추적한다.
- 01 확률과정을 정의한다는 것은 무엇인가
- 02 마르코프 체인의 네 가지 얼굴 — 전이행렬에서 에르고딕 정리까지
- 03 Poisson 과정은 왜 세 가지 얼굴을 가지는가
- 04 연속시간 마르코프 체인의 통일 원리 — Q-matrix에서 정상분포까지
- 05 마팅게일은 왜 현대 AI 이론의 언어인가
- 06 브라운 운동은 왜 이토 적분을 강제하는가
- 07 MCMC는 왜 복잡한 분포에서도 작동하는가
Poisson 과정에는 세 가지 정의가 있다. 구간별 카운트가 Poisson 분포를 따른다는 카운트 관점, 이벤트 간 간격이 iid 지수분포라는 간격 관점, 짧은 시간 동안 이벤트 확률이 에 비례한다는 infinitesimal 관점. 셋은 동치다. 그런데 왜 이 사실이 자명하지 않은가? 그리고 이 동치성이 결합·분할·점프 확장·큐잉 이론 전반을 어떻게 하나의 구조로 꿰뚫는가?
동치성의 핵심: 지수분포의 메모리리스
세 정의를 연결하는 열쇠는 지수분포의 메모리리스 성질이다.
“이미 만큼 기다렸다”는 정보가 앞으로의 대기시간 분포를 전혀 바꾸지 않는다. 이 성질은 지수분포에만 있다. 생존함수 가 Cauchy 함수방정식 를 만족하면, 우연속 단조감소 조건 하에서 가 유일한 해이기 때문이다.
양의 연속 확률변수 에 대해 다음은 동치다.
- for all
: .
: 로 놓으면 가정에서 . 가 우연속 비증가이면 가 유일한 해. 이므로 .
메모리리스에서 B ⇒ A 방향이 따라온다. 간격이 iid 지수이면 각 시점에서 “다음 이벤트까지의 시간”이 과거 이력과 독립된다. 그 결과 서로소 구간의 카운트가 독립이 되고, 분포는 Poisson이 된다. 반대로 A ⇒ B 방향은 이고 임을 관찰하는 것으로 시작한다. C ⇔ A는 Taylor 전개로 확인된다.
세 정의가 닫힌 순환을 이룬다는 것이 Poisson 과정의 첫 번째 구조적 사실이다.
합과 분할에 닫혀 있음
Poisson 과정이 강력한 이유는 연산에 닫혀 있기 때문이다.
합(Superposition): 독립 Poisson 과정 둘을 합치면 그 합도 Poisson이다. rate는 더해진다. 특성함수로 확인하면 간단하다.
분할(Thinning): 각 이벤트를 확률 로 독립적으로 유지하면, 유지된 이벤트는 rate 의 Poisson 과정이다. 제거된 이벤트는 rate 의 독립 Poisson 과정이다. 두 thinned 과정은 서로 독립이다.
이 두 성질은 비균질 Poisson으로 자연스럽게 확장된다. rate 가 시간에 따라 변하면 cumulative intensity 가 모든 정보를 요약한다. 비균질 Poisson 와 rate 1의 균질 Poisson 은 시간 변환으로 연결된다.
이 관계가 Lewis-Shedler 알고리즘의 기초다. 인 상한을 잡고 rate 의 균질 Poisson을 시뮬레이션한 뒤, 각 이벤트를 확률 로 accept한다. Neural TPP 모델의 생성 과정이 정확히 이 구조를 따른다.
Superposition과 thinning의 결과는 독립성을 전제한다. 이벤트 스트림 사이에 자기흥분(self-excitation)이 있으면 — 하나의 이벤트가 다른 이벤트 확률을 높이면 — Poisson 구조가 깨진다. 이 경우 Hawkes process가 적절한 확장이다. Poisson은 “이벤트 간 상호작용 없음”이라는 가정의 수학적 표현이다.
복합 Poisson: Lévy 과정으로의 확장
각 이벤트에 단순 카운트 대신 랜덤 크기 를 부여하면 복합 Poisson 과정이 된다.
평균과 분산은 Wald 항등식으로 깔끔하게 계산된다.
분산 공식의 항은 를 합친 결과로, Poisson의 성질이 결합해 단일 term으로 정리된다.
특성함수는 더 우아하다.
이 형태 가 Lévy 과정의 서명이다. 이 Lévy exponent이고, 대응하는 Lévy measure는 — 유한 전체 질량을 갖는 측도다. 브라운 운동이 Lévy measure가 없는 연속 Lévy 과정이라면, 복합 Poisson은 유한 활동도(finite activity)의 불연속 Lévy 과정이다. Merton의 점프-확산 모델이나 Neural SDE with jumps가 이 구조 위에 세워진다.
큐잉 이론: Little의 법칙과 ρ의 폭발
Poisson 도착 과정은 큐잉 이론으로 곧바로 이어진다. M/M/1 큐는 Poisson 도착(rate ), 지수 서비스(rate ), 서버 1대의 시스템이다. 상태 수 에 대한 detailed balance 조건
을 풀면 정상분포가 기하분포로 나온다.
일 때만 정상분포가 존재한다. 평균 고객 수는 이며 에서 발산한다. 면 , 면 — utilization의 미세한 증가가 latency를 폭발시킨다.
이 관계를 가장 일반적으로 표현한 것이 Little의 법칙이다.
은 시스템 내 평균 고객 수, 는 평균 체류시간이다. 이 등식이 놀라운 이유는 Poisson 가정도, 지수 서비스 가정도, 서버 수 가정도 필요 없기 때문이다. 정상성과 유한 평균만 있으면 된다. 증명의 핵심은 라는 경로 항등식이다 — 각 고객이 체류하는 동안 “단위 시간씩” 기여한다.
정리
- Poisson 과정의 세 정의(카운트/간격/infinitesimal)는 동치이며, 지수분포의 메모리리스가 이 동치성을 떠받친다.
- Poisson 과정은 합(superposition)과 분할(thinning)에 닫혀 있다. 비균질 확장은 cumulative intensity 와 시간 변환으로 균질 과정으로 환원된다.
- 복합 Poisson은 유한 활동도 Lévy 과정의 대표 사례다. 특성함수 가 평균·분산·CLT를 한 구조로 묶는다.
- M/M/1의 과 Little의 법칙 는 Poisson 도착이 실시간 서비스 시스템에서 어떻게 latency를 결정하는지의 수학적 언어다.
Poisson 과정을 이해한다는 것은 “이벤트가 독립적으로 발생한다”는 가정이 어떤 구조를 만들어내는지 — 그리고 그 가정이 깨지는 순간(Hawkes, Cox process) 어디로 가야 하는지 — 를 아는 것이다.