에켈랜드의 변분 원리

이전 글에서 살펴본 변분법의 기본 정리(직접법)는 공간이 반사적이거나 함수가 강압적일 때 최솟값이 존재한다는 것을 보장한다. 하지만 최솟값이 존재하지 않거나, 공간이 완비거리공간이지만 반사적이지 않은 경우에는 직접법을 사용할 수 없다.

이러한 상황에서 사용할 수 있는 도구가 에켈랜드 변분 원리이다. 이 원리는 비록 최솟값은 아닐지라도, 최솟값에 충분히 가까운 점이 최솟값과 유사한 성질을 가진다는 것을 보여준다. 기하학적으로는 원래 함수에 뾰족한 섭동(perturbation)을 주면 그 근사점이 새로운 함수의 엄밀한 최솟값이 된다는 것을 의미한다.

이 글에서 \(M\)은 완비거리공간을 나타낸다. 에켈랜드 원리는 선형 구조가 없는 거리공간에서도 성립한다는 점이 큰 장점이다.

정리 1. (에켈랜드 변분 원리)

\((M, d)\)가 완비거리공간이고 \(F : M \rightarrow \mathbb{R} \cup \{+\infty\}\)가 아래로 유계이며 하반연속인 함수라고 하자. (단, \(F \not\equiv +\infty\)라고 하자.)

\(\epsilon > 0\)이 주어졌을 때, \(u \in M\)이 다음 조건을 만족한다고 가정하자. \[F(u) \leq \inf_{x \in M} F(x) + \epsilon .\] 그러면 다음 세 조건을 만족하는 \(v \in M\)이 존재한다.

\(F(v) \leq F(u)\)
\(d(u,\, v) \leq 1\)
모든 \(w \neq v\)에 대하여 \(F(v) < F(w) + \epsilon d(v,\, w).\)

세 번째 조건은 \(v\)가 섭동된 범함수 \(G(w) = F(w) + \epsilon d(v, w)\)의 유일한 전역 최솟값임을 의미한다. 즉, 원래 함수 \(F\)는 최솟값을 갖지 않을 수 있지만, 거리항을 더해 주면 최솟값을 갖게 만들 수 있다는 것이다.

증명

\(M\) 위에 다음과 같은 관계 \(\preceq\)를 정의하자. \[w \preceq z \quad \Longleftrightarrow \quad F(w) + \epsilon d(w, z) \leq F(z).\] 이 관계는 부분순서가 된다.

이제 귀납적으로 수열 \(\{u_n\}\)을 구성하자. 먼저 \(u_0=u\)라고 두고, \[S_n:=\{w\in M: w\preceq u_n\}\] 라고 정의하자. \(u_n\in S_n\)이므로 \(S_n\)은 공집합이 아니다. 또한 \[S_n=\{w\in M: F(w)+\epsilon d(w,u_n)\le F(u_n)\}\] 이므로, \(F\)의 하반연속성과 거리함수의 연속성에 의해 \(S_n\)은 닫힌집합이다.

이제 \(u_n\)이 정해졌다고 하자. \(u_{n+1}\in S_n\)을 \[F(u_{n+1})\le \inf_{w\in S_n}F(w)+\frac{1}{n+1}\] 을 만족하도록 택한다.

\(w\in S_{n+1}\)이면 \(w\preceq u_{n+1}\preceq u_n\)이므로 \(w\preceq u_n\), 즉 \(w\in S_n\)이다. 따라서 \[S_{n+1}\subset S_n\] 이다.

또한 \(w\in S_{n+1}\)이면 \(w\preceq u_{n+1}\)이므로 \[\epsilon d(w,u_{n+1})\le F(u_{n+1})-F(w)\le F(u_{n+1})-\inf_{x\in S_n}F(x)\le \frac{1}{n+1}.\] 따라서 임의의 \(w_1,w_2\in S_{n+1}\)에 대하여 \[d(w_1,w_2)\le d(w_1,u_{n+1})+d(w_2,u_{n+1})\le \frac{2}{\epsilon(n+1)}.\] 즉, \[\operatorname{diam}(S_{n+1})\le \frac{2}{\epsilon(n+1)}\to 0.\] 그러므로 완비거리공간에서의 칸토어 교집합 정리에 의해 \[\bigcap_{n=0}^\infty S_n\] 은 정확히 한 점 \(v\)만을 원소로 가진다. 이 점 \(v\)가 우리가 찾는 점이다.

\(v\in S_0\)이므로 \(v\preceq u\)이다. 따라서 \[F(v)+\epsilon d(v,u)\le F(u).\] 특히 \(F(v)\le F(u)\)이다.
위 부등식과 가정 \[F(u)\le \inf_{x\in M}F(x)+\epsilon\] 을 이용하면 \[\epsilon d(v,u)\le F(u)-F(v)\le \inf_{x\in M}F(x)+\epsilon-\inf_{x\in M}F(x)=\epsilon.\] 따라서 \(d(v,u)\le 1\)이다.
이제 \(w\preceq v\)라고 하자. \(v\in S_n\)이므로 \(v\preceq u_n\)이고, 추이성에 의해 \(w\preceq u_n\)이다. 따라서 \(w\in S_n\)이 모든 \(n\)에 대해 성립한다. 그러므로 \[w\in \bigcap_{n=0}^\infty S_n=\{v\},\] 즉 \(w=v\)이다. 따라서 \(w\neq v\)이면 \(w\preceq v\)일 수 없으므로 \[F(v)

에켈랜드 변분 원리는 미분가능한 함수에 적용될 때, 최솟값에 근접하는 점이 도함수가 \(0\)에 가까운 점(임계점에 가까운 점)임을 보여준다. 이 결과는 팔레-스메일 조건과 임계점 이론의 기초가 된다.

따름정리 2. (미분가능한 경우의 응용)

\(X\)가 바나흐 공간이고 \(F : X \rightarrow \mathbb{R}\)이 아래로 유계이며 하반연속이고 게토 미분가능하다고 하자. 임의의 \(\epsilon > 0\)에 대하여, \(F(u) \leq \inf F + \epsilon\)인 \(u\)가 주어지면, 다음을 만족시키는 \(v \in X\)가 존재한다.

\(F(v) \leq F(u)\)
\(\|v - u\| \leq 1\)
\(\|F'(v)\|_{X^*} \leq \epsilon\)

증명

정리 1에 의해 조건을 만족시키는 \(v\)가 존재한다. 정리 1의 세 번째 조건에 의해 모든 \(w \in X\)에 대해 \[F(v) \leq F(w) + \epsilon \|v - w\|\] 가 성립한다. 이제 고정된 \(h \in X\)와 \(t > 0\)에 대해 \(w = v + th\)를 대입하면 \[F(v) \leq F(v + th) + \epsilon t \|h\|\] 가 되고, 이 식을 정리하면 \[\frac{F(v + th) - F(v)}{t} \geq -\epsilon \|h\|\] 가 된다. \(t \to 0\)인 극한을 취하면 \(\langle F'(v), h \rangle \geq -\epsilon \|h\|\)이다. \(h\)를 \(-h\)로 바꾸면 부호가 반대인 부등식을 얻으므로, 결국 \(|\langle F'(v), h \rangle| \leq \epsilon \|h\|\)이다. 이것은 \(\|F'(v)\| \leq \epsilon\)을 의미한다.

이 따름정리는 매우 중요한 사실을 시사한다. 아래로 유계인 미분가능 함수 \(F\)에 대하여, 함숫값이 하한에 수렴하면서 동시에 도함수의 노름이 \(0\)으로 가는 수열을 구성할 수 있다는 것이다. 이러한 수열은 팔레-스메일 수열의 전형적인 예이며, 함수가 최솟값을 갖는 점을 직접 찾기 어려울 때에도 임계점의 존재를 탐구할 수 있게 해 준다. 특히 \(F(x_n)\to \inf F\)인 수열 \(\{x_n\}\)가 주어지면, 에켈랜드 변분 원리를 적절히 적용하여 \(F(y_n)\to \inf F\)이고 \(\|F'(y_n)\|_{X^*}\to 0\)인 수열 \(\{y_n\}\)을 구성할 수 있다. 이러한 수열은 임계점 이론에서 중요한 역할을 한다.

다음 글에서는 이러한 개념을 확장하여, 최솟값이 아닌 안장점 형태의 해를 찾는 산악 통행로 정리와 그 전제가 되는 팔레-스메일 조건을 살펴보자.

Functional Analysis Lecture Notes

에켈랜드의 변분 원리

약하반연속성과 최솟값의 존재성

팔레-스메일 조건과 산악 통행로 정리