#online-learning

총 2개의 글

AI 2026.04.28 · 11 min Advanced Stochastic Processes Deep Dive · 5

공정한 게임의 수학적 추상인 마팅게일이 SGD 수렴, RL 정책 평가, bandit 탐색-활용 균형까지 어떻게 하나의 언어로 연결되는가.

AI 2026.04.28 · 14 min Advanced Convex Optimization Deep Dive · 7

Logistic Regression의 수렴 보장부터 SVM 쌍대성, L1 희소성의 기하학, 비볼록 딥러닝의 역설, 그리고 온라인 학습의 Regret 경계까지 — 볼록 최적화라는 하나의 렌즈로 추적한다.