ReLU 신경망은 x=0에서 미분불가능하다. 그런데 PINN은 이 신경망으로 PDE를 풀고, 그것이 수렴한다고 주장한다. 어떻게 가능한가? 답은 “미분”의 의미를 바꾸는 데 있다. 약미분(weak derivative)에서 Sobolev 공간, Poincaré 부등식, Lax-Milgram 정리까지 — 이 개념들은 하나의 질문에 답하기 위해 연결된다: 비매끄러운 함수도 PDE의 해가 될 수 있는가?
고전 미분의 한계와 약미분
f(x)=∣x∣는 x=0에서 미분불가능하다. 좌미분은 −1, 우미분은 +1. 하지만 부분적분을 뒤집어 생각하면 다른 문로 들어설 수 있다.
고전 부분적분:
∫Ωf′(x)ϕ(x)dx=−∫Ωf(x)ϕ′(x)dx(ϕ∈Cc∞,경계항 0)
우변은 f가 미분불가능해도 계산할 수 있다. 그렇다면 우변을 만족하는 v가 존재하면 그것을 f의 도함수로 정의하면 된다. 이것이 약미분이다.
∫Ωvϕdx=(−1)∣α∣∫ΩuDαϕdx∀ϕ∈Cc∞(Ω)
∣x∣에 대해 이 조건을 만족하는 v는 sgn(x)다. 고전적으로는 x=0에서 정의되지 않지만, 약미분은 “거의 모든 곳(a.e.)“에서만 유일하면 충분하다. 측도 0인 집합에서의 값은 적분에 영향을 미치지 않는다.
명제 1
· 약미분의 유일성
u∈Lloc1(Ω)의 α-차 약도함수가 존재하면, a.e.에서 유일하다.
▷ 증명
v1, v2가 모두 약도함수라 하면, 모든 ϕ∈Cc∞에 대해
∫Ω(v1−v2)ϕdx=0
임의의 컴팩트 K⊂Ω 위에서 (v1−v2)+를 근사하는 Cc∞ 함수열로 극한을 취하면 (v1−v2)+=0 a.e. 마찬가지로 (v1−v2)−=0 a.e. □
∎
약미분이 있는 함수들의 집합 — Sobolev 공간
약미분을 k차까지 가지면서 도함수까지 Lp에 속하는 함수들을 모으면 공간이 된다.
Wk,p(Ω)={u∈Lp(Ω):Dαu∈Lp(Ω),∣α∣≤k}
노름은 함수와 도함수의 크기를 함께 측정한다.
∥u∥Wk,p=∣α∣≤k∑∫Ω∣Dαu∣pdx1/p
p=2인 경우 Hk(Ω)=Wk,2(Ω)는 내적을 가진 Hilbert 공간이 된다. 이 완비성이 핵심이다. Cauchy 수열 {un}⊂Wk,p가 있으면 각 다중지수 α에 대해 Dαun→vα in Lp이고, 극한을 취하면 vα=Dαu임을 확인할 수 있다. 공간이 닫혀 있다.
Poincaré 부등식 — 경계가 도함수를 통제한다
유계 영역 Ω에서 경계에서 0인 함수 u∈W01,p(Ω)는 도함수만으로 제어된다.
∥u∥Lp(Ω)≤CP∥∇u∥Lp(Ω)
1D 증명의 뼈대: u(0)=0이면 u(x)=∫0xu′(t)dt이고 Cauchy-Schwarz를 쓰면
∣u(x)∣2≤L∫0L∣u′(t)∣2dt
양변을 적분하면 ∥u∥L2≤L∥u′∥L2. 따라서 W01,p에서 ∥∇u∥Lp와 ∥u∥W1,p는 동치 노름이다. 이 사실이 아래 Lax-Milgram의 강제성 조건으로 직결된다.
✎ 트레이드오프: Poincaré 부등식의 적용 범위
경계 조건 u∣∂Ω=0이 없으면 Poincaré 부등식이 성립하지 않는다. 반례는 상수함수 u=1 — L2 노름은 양수지만 도함수는 0이다. PINN에서 경계 조건 손실항 λ2∥uθ∣∂Ω∥2을 제거할 수 없는 이유가 여기 있다.
그리고 Sobolev 매몰 정리는 미분가능성이 연속성을 함의하는 조건을 준다: Wk,p(Rn)이 C0에 매몰되려면 kp>n이어야 한다. 1D에서 W1,2(R)의 함수는 연속이다. 3D에서는 W1,2(R3)의 함수가 불연속일 수 있다. 고차원 PINN이 더 어려운 수학적 이유다.
Lax-Milgram 정리 — 약해의 존재성
PDE −Δu=f (u∣∂Ω=0)를 변분 형식으로 쓰면 고전 2계 도함수가 사라진다. 양변에 테스트 함수 v∈H01를 곱하고 Green 항등식을 쓰면:
∫Ω∇u⋅∇vdx=∫Ωfvdx∀v∈H01(Ω)
이를 추상화하면 a(u,v)=F(v) 꼴이다. Lax-Milgram 정리는 이 형식의 해가 존재하고 유일함을 보장한다.
정리 2
· Lax-Milgram
V가 Hilbert 공간, a:V×V→R이 연속(∣a(u,v)∣≤M∥u∥∥v∥)이고 강제적(a(u,u)≥α∥u∥2, α>0)이면, 임의의 F∈V∗에 대해 유일한 u∈V가 존재하여 a(u,v)=F(v) (∀v∈V). 또한 ∥u∥V≤∥F∥V∗/α.
Laplace 방정식에 적용하면: 연속성은 Cauchy-Schwarz, 강제성은 Poincaré 부등식에서 온다. 강제성 조건 a(u,u)≥α∥u∥2은 시스템이 “비퇴화”임을 보장한다. 강제성이 없으면 행렬로 치면 특이행렬 — 해가 없거나 무한히 많을 수 있다.
유한요소법은 이 이론의 직접 응용이다. V=H01를 유한차원 부분공간 Vh로 제한하면 같은 Lax-Milgram이 적용되고, Céa 보조정리가 오차를 최적 근사 오차의 상수배로 묶는다.
∥u−uh∥V≤Cvh∈Vhinf∥u−vh∥V
선형 FEM에서 H1 오차는 O(h), L2 오차는 O(h2)로 수렴한다.
PINN은 변분 에너지를 최소화한다
PINN 손실함수와 변분 에너지는 같은 문제의 두 표현이다.
J[u]=21∫Ω∣∇u∣2dx−∫Ωfudx
이 에너지의 Gâteaux 미분을 0으로 놓으면 정확히 약해 조건 a(u,v)=F(v)가 나온다. PINN이 PDE 잔차를 최소화하는 것은 이 에너지를 신경망으로 근사하는 것이고, Lax-Milgram의 조건이 충족될 때 수렴이 보장된다.
Tikhonov 정칙화 손실 ∥uθ−udata∥2+λ∥∇uθ∥L22은 H1 노름을 최소화하는 것과 같다. λ가 충분히 크면 Poincaré 부등식에 의해 해가 자동으로 더 좋은 함수공간에 놓인다.
정리
약미분은 부분적분을 뒤집어 미분불가능한 함수를 “미분”한다. ReLU의 역전파가 작동하는 이유도 동일한 원리다.
Sobolev 공간 Wk,p는 약미분을 가진 함수들의 완비 공간이다. 완비성이 수치 해석의 수렴 논증을 가능하게 한다.
Poincaré 부등식은 경계 조건이 있을 때 도함수가 함수 전체를 제어한다는 것을 보이고, 이것이 Lax-Milgram의 강제성으로 이어진다.
Lax-Milgram 정리는 “연속 + 강제적” 조건 아래 약해가 유일하게 존재함을 보장한다. PINN과 FEM은 이 정리의 서로 다른 수치 구현이다.
PINN이 작동하는 것은 경험적 우연이 아니라, 함수해석학이 미리 닦아놓은 길 위를 걷기 때문이다.