내적(inner product)은 단순한 연산이 아니다. 각도, 거리, 투영, 최적 근사, 부피 — 이 모든 기하적 개념이 내적 하나에서 파생된다. 제5장의 다섯 절은 각각 독립적인 주제처럼 보이지만, 실제로는 하나의 구조가 점점 더 풍부한 형태로 전개되는 과정이다. 왜 ATA의 조건수는 A의 제곱이 되고, QR 분해는 왜 그것보다 수치적으로 우월한가?
기하의 출발점: 내적과 Cauchy-Schwarz
실 벡터 공간 위의 내적은 세 공리로 정의된다 — 대칭성, 쌍선형성, 양의 정부호성. 이 세 조건의 최소 집합에서 모든 기하가 나온다. 유도 노름은
∥x∥=⟨x,x⟩
이고, 이 노름이 삼각부등식을 만족한다는 사실 자체가 이미 비자명하다.
정리 1
· Cauchy-Schwarz 부등식
임의의 x,y에 대해
∣⟨x,y⟩∣≤∥x∥∥y∥
등호 조건은 x와 y가 선형종속일 때이다.
▷ 증명
y=0. 임의의 t∈R에 대해 ⟨x+ty,x+ty⟩≥0을 전개하면
∥x∥2+2t⟨x,y⟩+t2∥y∥2≥0
이 이차식이 항상 ≥0이려면 판별식이 ≤0이어야 한다. 4⟨x,y⟩2−4∥x∥2∥y∥2≤0. ■
∎
Cauchy-Schwarz의 진짜 역할은 각도의 존재 보장이다. ∣cosθ∣≤1이 성립함은 이 부등식이 있어야 비로소 정의가 가능하다. L2 함수 공간도, 행렬 Frobenius 내적도, 가중 내적 ⟨x,y⟩W=xTWy도 — 공리만 만족하면 같은 기하가 성립한다.
정사영: 최적 근사의 기하 원리
부분공간 W로의 정사영은 “가장 가까운 점”을 찾는 문제의 해다.
정리 2
· Best Approximation
유한차원 부분공간 W와 벡터 v에 대해, 유일한 w∗∈W가 존재하여 ∥v−w∗∥≤∥v−w∥, ∀w∈W이다. 그 특징 조건은 v−w∗⊥W.
▷ 증명
W의 정규직교 기저 {q1,…,qk}를 취하고 w∗=∑i⟨v,qi⟩qi로 정의하면 v−w∗⊥W. 임의의 w∈W에 대해 피타고라스 정리를 적용하면
∥v−w∥2=∥v−w∗∥2+∥w∗−w∥2≥∥v−w∗∥2
유일성은 두 최소점이 동시에 존재하면 거리 0이 됨에서 따른다. ■
∎
정사영 행렬 P=A(ATA)−1AT는 두 성질로 완전히 특징지어진다 — P2=P (멱등)과 PT=P (대칭). 정규직교 기저 Q가 있으면 P=QQT로 단순화된다. 정사영의 고유값은 0과 1뿐이고, tr(P)=dimW이다.
최소제곱: 정사영의 대수적 구체화
과결정계 Ax=b (m≫n)는 일반적으로 해가 없다. 목표는 minx∥Ax−b∥2이고, 기하적으로는 b를 C(A)에 정사영하는 것이다. 직교 조건 AT(b−Ax∗)=0을 정리하면 정규방정식을 얻는다.
ATAx∗=ATb
여기서 핵심 함정이 있다.
⚠ 조건수 함정
A의 thin QR A=Q^R^을 이용하면 정규방정식은 R^x∗=Q^Tb로 바뀐다. 직접 ATA를 구성해 풀면 조건수가 κ(A)2로 증가하지만, QR로 풀면 κ(A)가 유지된다. A의 조건수가 104이면 ATA의 조건수는 108이 된다.
Gauss-Markov 정리는 이 OLS 추정량의 통계적 지위를 확립한다 — 가우시안 분포 가정 없이도, 선형 불편 추정량 중 분산이 최소임을 보장한다. Ridge 정규화 (ATA+αI)x=ATb는 조건수를 개선하는 동시에 prior x∼N(0,ασ2I)의 MAP 추정으로 해석된다.
Gram 행렬: 내적 구조의 행렬 압축
벡터 v1,…,vk의 Gram 행렬은 Gij=⟨vi,vj⟩, 행렬 표현으로는 G=ATA다.
xTGx=xTATAx=∥Ax∥2≥0
이 세 줄의 증명이 Gram 행렬이 항상 PSD임을 확립한다. G가 PD가 되는 정확한 조건은 {vi}의 선형독립과 동치다. 더 깊은 결과는 detG가 평행육면체의 부피의 제곱이라는 것이다 — QR 분해 A=QR에서 detG=det(RTR)=(detR)2=Volk2.
QR 분해: 다섯 조각의 통합
QR 분해의 세 시각 중 가장 통찰력 있는 것은 내적 관점이다 — ATA=RTR이므로 QR은 Gram 행렬의 Cholesky 루트다.