\[ \newcommand{\complexI}{\mathbf{i}} \newcommand{\imaginaryI}{\mathbf{i}} \newcommand{\cis}{\operatorname{cis}} \newcommand{\vecu}{\mathbf{u}} \newcommand{\vecv}{\mathbf{v}} \newcommand{\vecw}{\mathbf{w}} \newcommand{\vecx}{\mathbf{x}} \newcommand{\vecy}{\mathbf{y}} \newcommand{\vecz}{\mathbf{z}} \]

에켈랜드의 변분 원리

by LY4I
174 views

이전 글에서 살펴본 변분법의 기본 정리(직접법)는 공간이 반사적이거나 함수가 강압적일 때 최솟값이 존재한다는 것을 보장한다. 하지만 최솟값이 존재하지 않거나, 공간이 완비거리공간이지만 반사적이지 않은 경우에는 직접법을 사용할 수 없다.

이러한 상황에서 사용할 수 있는 도구가 에켈랜드 변분 원리이다. 이 원리는 비록 최솟값은 아닐지라도, 최솟값에 충분히 가까운 점이 최솟값과 유사한 성질을 가진다는 것을 보여준다. 기하학적으로는 원래 함수에 뾰족한 섭동(perturbation)을 주면 그 근사점이 새로운 함수의 엄밀한 최솟값이 된다는 것을 의미한다.

이 글에서 \(M\)은 완비거리공간을 나타낸다. 에켈랜드 원리는 선형 구조가 없는 거리공간에서도 성립한다는 점이 큰 장점이다.

정리 1. (에켈랜드 변분 원리)

\((M, d)\)가 완비거리공간이고 \(F : M \rightarrow \mathbb{R} \cup \{+\infty\}\)가 아래로 유계이며 하반연속인 함수라고 하자. (단, \(F \not\equiv +\infty\)라고 하자.)

\(\epsilon > 0\)이 주어졌을 때, \(u \in M\)이 다음 조건을 만족한다고 가정하자. \[F(u) \leq \inf_{x \in M} F(x) + \epsilon .\] 그러면 다음 세 조건을 만족하는 \(v \in M\)이 존재한다.

  1. \(F(v) \leq F(u)\)
  2. \(d(u,\, v) \leq 1\)
  3. 모든 \(w \neq v\)에 대하여 \(F(v) < F(w) + \epsilon d(v,\, w).\)

세 번째 조건은 \(v\)가 섭동된 범함수 \(G(w) = F(w) + \epsilon d(v, w)\)의 유일한 전역 최솟값임을 의미한다. 즉, 원래 함수 \(F\)는 최솟값을 갖지 않을 수 있지만, 약간의 선형적인 항을 더해주면 최솟값을 갖게 만들 수 있다는 것이다.

증명

\(M\) 위에 다음과 같은 관계 \(\preceq\)를 정의하자. \[w \preceq z \quad \Longleftrightarrow \quad F(w) + \epsilon d(w, z) \leq F(z) .\] 이 관계는 부분순서가 된다.

이제 귀납적으로 수열 \(\{u_n\}\)을 구성하자. 먼저 \(u_0 = u\)라고 두자. 그리고 \(u_n\)이 정의되었을 때, 집합 \(S_n\)을 다음과 같이 정의하자. \[S_n = \{w \in M : w \preceq u_n\} .\] \(S_n\)은 닫힌집합이며 공집합이 아니다. (즉 \(u_n \in S_n\)이다.) 이제 \(u_{n+1} \in S_n\)을 다음 조건을 만족하도록 선택한다. \[F(u_{n+1}) \leq \inf_{w \in S_n} F(w) + \frac{1}{n+1} .\] 이렇게 구성된 수열 \(\{u_n\}\)에 대하여 \(w \in S_{n+1}\)이면 \(w \preceq u_{n+1} \preceq u_n\)이므로 \(S_{n+1} \subset S_n\)이다. 또한 \(w \in S_n\)이면 \[\epsilon d(w, u_n) \leq F(u_n) - F(w) \leq F(u_n) - \inf_{x \in S_n} F(x)\] 이다. \(n \to \infty\)일 때 우변이 \(0\)으로 수렴하므로, \(S_n\)의 지름(diameter)은 \(0\)으로 수렴한다. 칸토어의 교집합 정리에 의하여 \(\cap S_n\)은 단 하나의 점 \(v\)를 원소로 가진다.

이 점 \(v\)가 우리가 찾는 점이다.

  1. \(v \in S_0\)이므로 \(v \preceq u\)이고, 따라서 \(F(v) \leq F(v) + \epsilon d(v, u) \leq F(u)\)이다.
  2. 가정에 의해 \(F(u) \leq \inf F + \epsilon\)이므로, \(\epsilon d(v, u) \leq F(u) - F(v) \leq \inf F + \epsilon - \inf F = \epsilon\)이다. 따라서 \(d(v, u) \leq 1\)이다.
  3. 만약 \(w \preceq v\)라면 \(w \in S_n\)이 모든 \(n\)에 대해 성립하므로 \(w = v\)여야 한다. 즉 \(v\)보다 작은 원소는 \(v\) 자신뿐이다. 이것은 \(w \neq v\)일 때 \(F(w) + \epsilon d(w, v) > F(v)\)임을 의미한다.

에켈랜드 변분 원리는 미분가능한 함수에 적용될 때, 최솟값에 근접하는 점이 도함수가 \(0\)에 가까운 점(임계점에 가까운 점)임을 보여준다. 이 결과는 팔레-스메일 조건과 임계점 이론의 기초가 된다.

따름정리 2. (미분가능한 경우의 응용)

\(X\)가 바나흐 공간이고 \(F : X \rightarrow \mathbb{R}\)이 아래로 유계이며 게토 미분가능하다고 하자. 임의의 \(\epsilon > 0\)에 대하여, \(F(u) \leq \inf F + \epsilon\)인 \(u\)가 주어지면, 다음을 만족시키는 \(v \in X\)가 존재한다.

  1. \(F(v) \leq F(u)\)
  2. \(\|v - u\| \leq 1\)
  3. \(\|F'(v)\|_{X^*} \leq \epsilon\)

증명

정리 1에 의해 조건을 만족시키는 \(v\)가 존재한다. 정리 1의 세 번째 조건에 의해 모든 \(w \in X\)에 대해 \[F(v) \leq F(w) + \epsilon \|v - w\|\] 가 성립한다. 이제 고정된 \(h \in X\)와 \(t > 0\)에 대해 \(w = v + th\)를 대입하면 \[F(v) \leq F(v + th) + \epsilon t \|h\|\] 가 되고, 이 식을 정리하면 \[\frac{F(v + th) - F(v)}{t} \geq -\epsilon \|h\|\] 가 된다. \(t \to 0\)인 극한을 취하면 \(\langle F'(v), h \rangle \geq -\epsilon \|h\|\)이다. \(h\)를 \(-h\)로 바꾸면 부호가 반대인 부등식을 얻으므로, 결국 \(|\langle F'(v), h \rangle| \leq \epsilon \|h\|\)이다. 이것은 \(\|F'(v)\| \leq \epsilon\)을 의미한다.

이 따름정리는 매우 중요한 사실을 시사한다. 아래로 유계인 미분가능 함수 \(F\)에 대하여, 함숫값이 하한에 수렴하는 수열 \(\{x_n\}\) (\(F(x_n) \to \inf F\))이 있다면, 우리는 언제나 \(\|F'(y_n)\| \to 0\)을 만족시키는 또 다른 수열 \(\{y_n\}\)을 (원래 수열 근처에서) 찾을 수 있다는 것이다. 이러한 수열을 팔레-스메일 수열(Palais-Smale sequence)이라고 부른다. 이 결과는 함수가 최솟값을 갖는 점을 찾기 어려울 때에도 임계점의 존재를 탐구할 수 있는 길을 열어준다.

다음 글에서는 이러한 개념을 확장하여, 최솟값이 아닌 안장점 형태의 해를 찾는 산악 통행로 정리와 그 전제가 되는 팔레-스메일 조건을 살펴보자.