SDE 수치 해법의 통일 원리: 오차, 안정성, 다중 레벨
Euler-Maruyama의 강/약수렴 차이부터 Milstein의 이토 Taylor 보정, 암시적 기법의 A-안정성, Multilevel Monte Carlo의 복잡도 최적화까지, SDE 수치 해법의 설계 논리를 추적한다.
- 01 이토 적분은 왜 경로별로 정의할 수 없는가
- 02 이토 공식은 왜 2차 항을 버리지 않는가
- 03 SDE는 미분방정식이 아니다 — 적분, 해의 존재, 그리고 생성모델의 연결
- 04 Langevin Dynamics는 왜 원하는 분포로 수렴하는가
- 05 SDE 수치 해법의 통일 원리: 오차, 안정성, 다중 레벨
- 06 Diffusion 모델은 왜 Score를 배우는가
- 07 SDE, ODE, Flow — 생성 모델을 하나의 언어로
연속 시간 SDE 를 컴퓨터로 푸는 방법은 하나가 아니다. Euler-Maruyama(EM), Milstein, Implicit Euler, Multilevel Monte Carlo — 이 기법들은 서로 다른 문제를 해결하지만, 모두 같은 하나의 물음에서 출발한다. 이산화 오차를 어디서 줄이고, 어디서 버릴 것인가?
이산화의 출발점: Euler-Maruyama
EM의 아이디어는 단순하다. 시간 구간 를 개 스텝으로 나누고, 각 스텝에서 드리프트와 확산을 선형 근사한다.
이때 오차는 두 종류로 갈라진다.
**강수렴(strong convergence)**은 경로 자체의 정확도다.
**약수렴(weak convergence)**은 분포의 정확도다.
같은 스킴이 강수렴 차수 , 약수렴 차수 을 가진다. 왜 다른가?
EM의 국소 오차 는 마팅게일이다. 경로 노름에서는 Doob 최대값 부등식으로 가 살아남고, 기댓값에서는 마팅게일 성질로 이 항이 사라져 3차 항에서 가 나온다.
국소 오차의 크기: (이토 등거리). 스텝 누적 후 Discrete Gronwall 부등식을 적용하면 , 제곱근으로 강수렴 차수 . 약수렴은 (마팅게일)이므로 3차 항이 지배하여 .
이 구분은 실전에서 중요하다. DDPM 샘플링에서 각 생성 경로의 품질은 강수렴에 달려 있고, 유럽형 옵션 가격 추정은 약수렴으로 충분하다. 배리어 옵션처럼 경로 의존 payoff가 불연속이면 약수렴이 로 붕괴된다.
Milstein: 이토 Taylor 전개의 다음 항
EM이 이토 Taylor 전개의 1차 항만 취한다면, Milstein은 2차 항을 추가한다.
이토 공식으로 임을 유도할 수 있다. Milstein 스킴은 이 항을 더한다.
결과로 국소 오차가 로 감소하고, 전역 강수렴 차수가 로 올라간다.
(상수)이면 이어서 Milstein 추가항이 자동으로 0이 된다. Additive noise SDE에서는 EM이 이미 강수렴 차수 1을 가진다.
실용적 함의: GBM처럼 multiplicative noise가 있는 SDE에서 동일 정확도를 달성하려면, Milstein은 EM보다 4배 적은 스텝으로 충분하다. 다차원에서는 교차 Lévy 영역 샘플링이 필요해 복잡도가 늘지만, Stratonovich 해석으로 단순화할 수 있다.
안정성: Stiff SDE와 암시적 기법
수렴 차수만이 전부가 아니다. Ornstein-Uhlenbeck SDE 에서 이면, EM의 mean-square 안정 조건
은 을 요구한다. 즉 100만 스텝 이상이 필요하다.
Implicit Euler(drift-implicit)는 이 제약에서 자유롭다.
분모 가 가 클수록 커지므로, 어떤 에서도 자동으로 감쇠한다 — A-stable이다.
| 기법 | 강수렴 | 약수렴 | 안정성 | 비용 |
|---|---|---|---|---|
| EM | 조건부 | |||
| Milstein | 조건부 | |||
| Implicit IE | A-stable | |||
| Stochastic Heun | 개선됨 |
DDPM fast sampling 연구에서 큰 스텝을 사용하려면 안정성이 필수다. Score network의 기울기가 크면(고주파 학습) drift 계수가 커져 stiff SDE가 되고, EM은 스텝 수를 강제로 늘리게 된다. 암시적 기법이나 Stochastic Heun을 쓰면 4~8 스텝으로도 reasonable한 샘플을 생성할 수 있다.
Multilevel Monte Carlo: 복잡도의 근본 문제
표준 Monte Carlo로 를 오차 으로 추정하려면, bias와 variance를 동시에 제어해야 한다. EM()에서 bias를 으로 맞추면 , 각 샘플 비용 , 총 비용 이다.
Giles(2008)의 **Multilevel Monte Carlo(MLMC)**는 이 복잡도를 망원합으로 깬다.
각 레벨 에서 스텝 크기 의 fine 경로와 coarse 경로를 같은 브라운 운동으로 생성해 차이 를 계산한다. 높은 레벨일수록 두 경로가 비슷해져 분산이 급격히 줄어든다. 최적 샘플 배분은 라그랑주 최적화로 결정된다.
Milstein()을 쓰면 이고 비용은 이므로, 총 복잡도가 로 줄어든다.
\text{MC(EM)}: O(\epsilon^{-3}) \quad \longrightarrow \quad \text{MLMC(Milstein)}: O(\epsilon^{-2}) }$$ $\epsilon = 0.001$에서 이 차이는 1000배다. <Callout type="note" title="트레이드오프"> MLMC의 이득은 분산이 레벨에 따라 decay할 때만 현실화된다. Barrier option처럼 payoff가 불연속이면 분산 decay가 약해져($\gamma < 1$) 이득이 줄어든다. Milstein의 다차원 교차항 계산이 복잡할 경우 EM MLMC($O(\epsilon^{-2.5})$)로 타협하는 선택도 있다. </Callout> ## 정리 - EM의 강수렴 $O(h^{1/2})$과 약수렴 $O(h)$ 차이는 마팅게일 성질에서 온다. 경로가 필요하면 강수렴, 기댓값이면 약수렴을 기준으로 삼는다. - Milstein은 이토 Taylor 2차 항 $\frac{1}{2}\sigma'\sigma[(\Delta B)^2 - h]$를 추가해 강수렴 차수를 1로 올린다. Multiplicative noise가 있는 SDE에서 실질적인 계산 절감을 준다. - Stiff SDE에서 EM은 스텝 크기 제약에 발목이 잡힌다. Implicit Euler는 A-stable이지만 정확도는 별개다. - MLMC는 수렴 구조를 계층화해 복잡도를 $O(\epsilon^{-3}) \to O(\epsilon^{-2})$로 낮춘다. 이 이득은 강수렴이 좋은 Milstein과 결합할 때 최대화된다. 이 네 기법은 각자 다른 병목을 공격하지만, 공통 질문에 답한다 — 이토 Taylor 전개의 어느 항을 보존하고, 어느 항을 버릴 것인가.