IQ Lab
← all posts
AI 2026.04.28 · 12 min read Advanced

PINN은 왜 작동하는가 — 함수해석학이 만든 근거

약미분부터 Lax-Milgram 정리까지, PINN과 유한요소법의 이론적 뿌리를 추적한다. 비매끄러운 함수도 PDE의 해가 될 수 있다는 주장이 어디서 오는지, 그 수학적 근거를 추적한다.


ReLU 신경망은 x=0x=0에서 미분불가능하다. 그런데 PINN은 이 신경망으로 PDE를 풀고, 그것이 수렴한다고 주장한다. 어떻게 가능한가? 답은 “미분”의 의미를 바꾸는 데 있다. 약미분(weak derivative)에서 Sobolev 공간, Poincaré 부등식, Lax-Milgram 정리까지 — 이 개념들은 하나의 질문에 답하기 위해 연결된다: 비매끄러운 함수도 PDE의 해가 될 수 있는가?

고전 미분의 한계와 약미분

f(x)=xf(x) = |x|x=0x=0에서 미분불가능하다. 좌미분은 1-1, 우미분은 +1+1. 하지만 부분적분을 뒤집어 생각하면 다른 문로 들어설 수 있다.

고전 부분적분:

Ωf(x)ϕ(x)dx=Ωf(x)ϕ(x)dx(ϕCc,  경계항 0)\int_{\Omega} f'(x)\,\phi(x)\,dx = -\int_{\Omega} f(x)\,\phi'(x)\,dx \quad (\phi \in C_c^\infty,\; \text{경계항 0})

우변은 ff가 미분불가능해도 계산할 수 있다. 그렇다면 우변을 만족하는 vv가 존재하면 그것을 ff의 도함수로 정의하면 된다. 이것이 약미분이다.

Ωvϕdx=(1)αΩuDαϕdxϕCc(Ω)\int_{\Omega} v\,\phi\,dx = (-1)^{|\alpha|}\int_{\Omega} u\,D^\alpha\phi\,dx \quad \forall\,\phi \in C_c^\infty(\Omega)

x|x|에 대해 이 조건을 만족하는 vvsgn(x)\operatorname{sgn}(x)다. 고전적으로는 x=0x=0에서 정의되지 않지만, 약미분은 “거의 모든 곳(a.e.)“에서만 유일하면 충분하다. 측도 0인 집합에서의 값은 적분에 영향을 미치지 않는다.

명제 1 · 약미분의 유일성

uLloc1(Ω)u \in L^1_{\mathrm{loc}}(\Omega)α\alpha-차 약도함수가 존재하면, a.e.에서 유일하다.

▷ 증명

v1v_1, v2v_2가 모두 약도함수라 하면, 모든 ϕCc\phi \in C_c^\infty에 대해

Ω(v1v2)ϕdx=0\int_\Omega (v_1 - v_2)\,\phi\,dx = 0

임의의 컴팩트 KΩK \subset \Omega 위에서 (v1v2)+(v_1 - v_2)^+를 근사하는 CcC_c^\infty 함수열로 극한을 취하면 (v1v2)+=0(v_1 - v_2)^+ = 0 a.e. 마찬가지로 (v1v2)=0(v_1-v_2)^- = 0 a.e. □

약미분이 있는 함수들의 집합 — Sobolev 공간

약미분을 kk차까지 가지면서 도함수까지 LpL^p에 속하는 함수들을 모으면 공간이 된다.

Wk,p(Ω)={uLp(Ω):DαuLp(Ω),  αk}W^{k,p}(\Omega) = \bigl\{u \in L^p(\Omega) : D^\alpha u \in L^p(\Omega),\; |\alpha| \leq k\bigr\}

노름은 함수와 도함수의 크기를 함께 측정한다.

uWk,p=(αkΩDαupdx)1/p\|u\|_{W^{k,p}} = \left(\sum_{|\alpha|\leq k} \int_\Omega |D^\alpha u|^p\,dx\right)^{1/p}

p=2p=2인 경우 Hk(Ω)=Wk,2(Ω)H^k(\Omega) = W^{k,2}(\Omega)는 내적을 가진 Hilbert 공간이 된다. 이 완비성이 핵심이다. Cauchy 수열 {un}Wk,p\{u_n\} \subset W^{k,p}가 있으면 각 다중지수 α\alpha에 대해 DαunvαD^\alpha u_n \to v_\alpha in LpL^p이고, 극한을 취하면 vα=Dαuv_\alpha = D^\alpha u임을 확인할 수 있다. 공간이 닫혀 있다.

Poincaré 부등식 — 경계가 도함수를 통제한다

유계 영역 Ω\Omega에서 경계에서 0인 함수 uW01,p(Ω)u \in W^{1,p}_0(\Omega)는 도함수만으로 제어된다.

uLp(Ω)CPuLp(Ω)\|u\|_{L^p(\Omega)} \leq C_P\,\|\nabla u\|_{L^p(\Omega)}

1D 증명의 뼈대: u(0)=0u(0)=0이면 u(x)=0xu(t)dtu(x) = \int_0^x u'(t)\,dt이고 Cauchy-Schwarz를 쓰면

u(x)2L0Lu(t)2dt|u(x)|^2 \leq L\int_0^L |u'(t)|^2\,dt

양변을 적분하면 uL2LuL2\|u\|_{L^2} \leq L\|u'\|_{L^2}. 따라서 W01,pW^{1,p}_0에서 uLp\|\nabla u\|_{L^p}uW1,p\|u\|_{W^{1,p}}는 동치 노름이다. 이 사실이 아래 Lax-Milgram의 강제성 조건으로 직결된다.

트레이드오프: Poincaré 부등식의 적용 범위

경계 조건 uΩ=0u|_{\partial\Omega}=0이 없으면 Poincaré 부등식이 성립하지 않는다. 반례는 상수함수 u=1u=1L2L^2 노름은 양수지만 도함수는 0이다. PINN에서 경계 조건 손실항 λ2uθΩ2\lambda_2\|u_\theta|_{\partial\Omega}\|^2을 제거할 수 없는 이유가 여기 있다.

그리고 Sobolev 매몰 정리는 미분가능성이 연속성을 함의하는 조건을 준다: Wk,p(Rn)W^{k,p}(\mathbb{R}^n)C0C^0에 매몰되려면 kp>nkp > n이어야 한다. 1D에서 W1,2(R)W^{1,2}(\mathbb{R})의 함수는 연속이다. 3D에서는 W1,2(R3)W^{1,2}(\mathbb{R}^3)의 함수가 불연속일 수 있다. 고차원 PINN이 더 어려운 수학적 이유다.

Lax-Milgram 정리 — 약해의 존재성

PDE Δu=f-\Delta u = f (uΩ=0u|_{\partial\Omega}=0)를 변분 형식으로 쓰면 고전 2계 도함수가 사라진다. 양변에 테스트 함수 vH01v \in H^1_0를 곱하고 Green 항등식을 쓰면:

Ωuvdx=ΩfvdxvH01(Ω)\int_\Omega \nabla u \cdot \nabla v\,dx = \int_\Omega f\,v\,dx \quad \forall\,v \in H^1_0(\Omega)

이를 추상화하면 a(u,v)=F(v)a(u,v) = F(v) 꼴이다. Lax-Milgram 정리는 이 형식의 해가 존재하고 유일함을 보장한다.

정리 2 · Lax-Milgram

VV가 Hilbert 공간, a:V×VRa: V\times V \to \mathbb{R}이 연속(a(u,v)Muv|a(u,v)|\leq M\|u\|\|v\|)이고 강제적(a(u,u)αu2a(u,u)\geq\alpha\|u\|^2, α>0\alpha>0)이면, 임의의 FVF\in V^*에 대해 유일한 uVu\in V가 존재하여 a(u,v)=F(v)a(u,v)=F(v) (vV\forall\,v\in V). 또한 uVFV/α\|u\|_V \leq \|F\|_{V^*}/\alpha.

Laplace 방정식에 적용하면: 연속성은 Cauchy-Schwarz, 강제성은 Poincaré 부등식에서 온다. 강제성 조건 a(u,u)αu2a(u,u) \geq \alpha\|u\|^2은 시스템이 “비퇴화”임을 보장한다. 강제성이 없으면 행렬로 치면 특이행렬 — 해가 없거나 무한히 많을 수 있다.

유한요소법은 이 이론의 직접 응용이다. V=H01V = H^1_0를 유한차원 부분공간 VhV_h로 제한하면 같은 Lax-Milgram이 적용되고, Céa 보조정리가 오차를 최적 근사 오차의 상수배로 묶는다.

uuhVCinfvhVhuvhV\|u - u_h\|_V \leq C\inf_{v_h \in V_h}\|u - v_h\|_V

선형 FEM에서 H1H^1 오차는 O(h)O(h), L2L^2 오차는 O(h2)O(h^2)로 수렴한다.

PINN은 변분 에너지를 최소화한다

PINN 손실함수와 변분 에너지는 같은 문제의 두 표현이다.

J[u]=12Ωu2dxΩfudxJ[u] = \frac{1}{2}\int_\Omega|\nabla u|^2\,dx - \int_\Omega f\,u\,dx

이 에너지의 Gâteaux 미분을 0으로 놓으면 정확히 약해 조건 a(u,v)=F(v)a(u,v) = F(v)가 나온다. PINN이 PDE 잔차를 최소화하는 것은 이 에너지를 신경망으로 근사하는 것이고, Lax-Milgram의 조건이 충족될 때 수렴이 보장된다.

Tikhonov 정칙화 손실 uθudata2+λuθL22\|u_\theta - u_{\mathrm{data}}\|^2 + \lambda\|\nabla u_\theta\|_{L^2}^2H1H^1 노름을 최소화하는 것과 같다. λ\lambda가 충분히 크면 Poincaré 부등식에 의해 해가 자동으로 더 좋은 함수공간에 놓인다.

정리

  • 약미분은 부분적분을 뒤집어 미분불가능한 함수를 “미분”한다. ReLU의 역전파가 작동하는 이유도 동일한 원리다.
  • Sobolev 공간 Wk,pW^{k,p}는 약미분을 가진 함수들의 완비 공간이다. 완비성이 수치 해석의 수렴 논증을 가능하게 한다.
  • Poincaré 부등식은 경계 조건이 있을 때 도함수가 함수 전체를 제어한다는 것을 보이고, 이것이 Lax-Milgram의 강제성으로 이어진다.
  • Lax-Milgram 정리는 “연속 + 강제적” 조건 아래 약해가 유일하게 존재함을 보장한다. PINN과 FEM은 이 정리의 서로 다른 수치 구현이다.

PINN이 작동하는 것은 경험적 우연이 아니라, 함수해석학이 미리 닦아놓은 길 위를 걷기 때문이다.