#adaptive-optimizer

AI 2026.04.28 · 13 min Advanced Optimization Theory Deep Dive · 4

AdaGrad의 누적 분산에서 출발해 RMSProp의 이동평균, Adam의 편향 보정, 수렴 반례, 그리고 AMSGrad·AdamW·Lion까지 — adaptive optimizer 계보의 설계 결정을 추적한다.