이전 글에서 증명 없이 한-바나흐 정리를 소개하였다. 또한 특수한 경우로서 노름벡터공간에서의 한-바나흐 정리의 증명을 소개하였다. 이 글에서는 일반적인 경우에 대한 한-바나흐 정리의 증명을 소개한다.
정의 1. (반순서와 전순서)
\(\mathcal{M}\)이 공집합이 아닌 집합이고 \(\prec\)가 \(M\)에서의 순서관계라고 가정하자. 만약 \(\prec\)가 다음을 모두 만족시키면, \(\prec\)를 \(M\)에서의 반순서라고 부른다.
- 모든 \(x \in \mathcal{M}\)에 대해 \(x \prec x\)이다.
- \(x \prec y\)이고 \(y \prec x\)이면 \(x = y\)이다.
- \(x \prec y\)이고 \(y \prec z\)이면 \(x \prec z\)이다.
이때 \(\mathcal{M}\)을 반순서집합이라고 부른다.
만약 \(\prec\)가 반순서이고, 임의의 \(x, y \in \mathcal{M}\)에 대해 \(x \prec y\) 또는 \(y \prec x\)라면, \(\prec\)를 전순서라고 부르며, \(\mathcal{M}\)을 전순서집합이라고 부른다.
\(\mathcal{N} \subset \mathcal{M}\)이고 \(\prec\)가 \(\mathcal{M}\)에서의 반순서일 때, \(\prec\)를 \(\mathcal{N}\)으로 제한하여 \(\mathcal{N}\)이 반순서집합이 되도록 할 수 있다. 전순서의 경우에도 마찬가지이다.
\(\mathcal{M}\)이 반순서가 주어진 집합이고 \(y \in \mathcal{M}\)이라고 하자. 이때 \(y\)가 \(\mathcal{M}\)의 극대원소라는 것은 \[y \prec x \quad\Rightarrow\quad y = x\] 가 성립함을 의미한다.
\(\mathcal{N} \subset \mathcal{M}\)이고 \(y \in \mathcal{M}\)일 때, \(y\)가 \(\mathcal{N}\)의 상계라는 것은 임의의 \(x \in \mathcal{N}\)에 대해 \(x \prec y\)를 만족시킴을 의미한다.
보기 2. (순서관계의 예)
다음은 자주 사용하는 순서관계의 예이다.
- \(\mathbb{R}\)에서의 통상적인 순서 \(\leq\)는 전순서이다.
- \(\mathbb{R}^2\)에서의 반순서를 다음과 같이 정의할 수 있다. \[(x_1,\, x_2) \prec (y_1, \, y_2) \quad\Longleftrightarrow\quad x_1 \leq y_1 \,\text{ and }\, x_2 \leq y_2 \,.\]
- \(S\)가 임의의 집합이고, \(\mathcal{M}\)이 \(S\)의 모든 부분집합들의 집합이라 하자. 집합의 포함관계 ‘\(\subset\)’는 \(\mathcal{M}\)에서의 반순서이다.
다음 정리는 선택 공리와 동치인 집합론의 정리이다. 여기서는 증명을 제시하지 않고 정리의 내용만 살펴보겠다.
정리 3. (Zorn의 보조정리)
\(\mathcal{M}\)이 공집합이 아닌 반순서집합이라고 하자. 또한 \(\mathcal{M}\)의 임의의 전순서부분집합이 상계를 가진다고 하자. 그러면 \(\mathcal{M}\)에 극대원소가 존재한다.
이제 한-바나흐 정리의 증명을 살펴보자.
정리 4. (한-바나흐 정리)
\(X\)가 실벡터공간이고, \(p\)가 \(X\)에서 정의된 부분선형범함수라고 하자. \(W\)가 \(X\)의 부분벡터공간이고 \(f_W\)가 \(W\)에서의 선형범함수이며, 임의의 \(w\in W\)에 대하여 다음을 만족시킨다고 가정하자. \[f_W(w) \leq p(w) .\tag{1}\] 그러면 \(f_W\)는 \(X\)에서의 확장함수 \(f_X\)를 가지며, 임의의 \(x\in X\)에 대하여 다음을 만족시킨다. \[f_X(x) \leq p(x) .\tag{2}\]
증명
다음 조건을 만족시키는 \(X\)에서의 선형범함수 \(f\)의 집합을 \(\mathcal{E}\)라 하자.
- \(f\)는 \(W \subset D_f \subset X\)를 만족하는 선형부분공간 \(D_f\)에서 정의된다.
- 임의의 \(w \in W\)에 대하여 \(f(w) = f_W(w)\)이다.
- 임의의 \(x \in D_f\)에 대하여 \(f(x) \leq p(x)\)이다.
즉, \(\mathcal{E}\)는 정의역에서 정리의 가정을 만족하는, 일반적인 부분공간 \(D_f \subset X\)에 대한 \(f_W\)의 모든 확장 \(f\)의 집합이다. 우리는 \(\mathcal{E}\)에 Zorn의 보조정리를 적용하여, 그 결과로 나오는 \(\mathcal{E}\)의 극대원소가 바라는 범함수임을 보일 것이다. 먼저, \(\mathcal{E}\)가 Zorn의 보조정리의 가정을 만족시키는지 확인하자.
\(f_W \in \mathcal{E}\)이므로 \(\mathcal{E} \neq \varnothing\)이다. 다음으로, \(\mathcal{E}\)에서 관계 \(\prec\)를 다음과 같이 정의한다. 즉 임의의 \(f, g \in \mathcal{E}\)에 대해, \(f \prec g\)이기 위한 필요충분조건을 \(D_f \subset D_g\)이면서 임의의 \(x \in D_f\)에 대하여 \(f(x) = g(x)\)인 것으로 정의한다. 즉, \(f \prec g\)는 \(g\)가 \(f\)의 확장함수인 경우이다. 이 관계 \(\prec\)는 \(\mathcal{E}\)에서 반순서임을 쉽게 확인할 수 있다. (이 순서는 전순서가 아니다. \(f_W\)의 확장이면서도 서로 확장관계가 아닌 범함수 \(f,\, g \in \mathcal{E}\)가 존재하기 때문이다.) 이제 \(\mathcal{G} \subset \mathcal{E}\)가 전순서집합이라고 가정하자. (\(\mathcal{G}\)가 전순서집합이라는 것은 임의의 \(f,\, g \in \mathcal{G}\)에 대하여, 이 범함수들 중 하나가 다른 것의 확장인 경우이다.)
집합 \(\mathcal{E}\)에서 \(\mathcal{G}\)의 상계를 구성하자. 집합 \[Z_{\mathcal{G}} = \bigcup_{f \in \mathcal{G}} D_f\] 를 정의하자. \(\mathcal{G}\)에서의 전순서관계를 사용하면, \(Z_{\mathcal{G}}\)가 \(X\)의 부분벡터공간임을 확인할 수 있다. 이제 \(Z_{\mathcal{G}}\)에서 선형범함수 \(f_{\mathcal{G}}\)를 정의하자. \(z \in Z_{\mathcal{G}}\)를 선택하자. 그러면 \(z \in D_{\xi}\)를 만족시키는 \(\xi \in \mathcal{E}\)가 존재한다. 이때 \(f_{\mathcal{G}}(z) = \xi(z)\)라고 정의한다. (이 같은 정의는 \(\xi\)에 의존하지 않는다. 왜냐하면, \(\eta\)가 \(z \in D_{\eta}\)를 만족하는 \(\mathcal{G}\)의 또 다른 범함수라면, \(\mathcal{G}\)의 순서관계에 의해 \(\xi(z) = \eta(z)\)이기 때문이다.) 다시 \(\mathcal{G}\)의 전순서를 사용하여 \(f_{\mathcal{G}}\)가 선형임을 확인할 수 있다. 또한 \(\xi \in \mathcal{E}\)이므로, \(f_{\mathcal{G}}(z) = \xi(z) \leq p(z)\)이고, \(z \in W\)이면 \(f_{\mathcal{G}}(z) = f_W(z)\)이다. 따라서 \(f_{\mathcal{G}} \in \mathcal{E}\)이고 모든 \(f \in \mathcal{G}\)에 대해 \(f \prec f_{\mathcal{G}}\)이다. 그래서 \(f_{\mathcal{G}}\)는 \(\mathcal{G}\)의 상계이다.
Zorn의 보조정리의 모든 가정이 만족됨을 보였으므로, \(\mathcal{E}\)에는 극대원소 \(f_{max}\)를 가진다. 이제 정의역이 \(D_{f_{max}} \neq X\)라고 가정하자. \(f_{max}\)의 확장함수가 존재하며, 이 확장함수는 \(\mathcal{E}\)에도 존재한다. 그러나 이것은 \(\mathcal{E}\)에서 \(f_{max}\)가 극대원소라는 사실에 모순이다. 따라서 \(D_{f_{max}} = X\)이다. 그러므로 \(f_X = f_{max}\)가 바라는 확장함수이다.
정리 4를 응용하는 예로서 볼록집합에 대한 분리 정리를 살펴보자.
정의 5. (민콥스키 범함수)
\(C\)가 실노름공간 \(X\)에서의 열린집합이고 \(0 \in C\)라고 하자. \(C\)의 민콥스키 범함수 \(p_C\)는 임의의 \(x \in X\)에 대하여 다음과 같이 정의된 함수이다. \[p_C(x) = \inf\{\alpha > 0 \,\vert\, \alpha^{-1}x \in C\} .\] (\(C\)가 열린집합이고 \(0 \in C\)이므로 우변의 집합이 공집합이 아니며, \(p_C(x)\)는 잘 정의된다.
보조정리 6.
\(C\)와 \(X\)가 정의 5에서와 같고, \(C\)가 볼록집합이라고 가정하자. 그러면 \(p_C\)는 \(X\)에서의 부분선형범함수이고 \[C = \{x : p_C(x) < 1\} \tag{3}\] 이다. 또한 상수 \(c > 0\)가 존재하여, 임의의 \(x \in X\)에 대하여 \[0 \leq p_C(x) \leq c\lVert x \rVert \tag{4}\] 를 만족시킨다.
증명
\(x, \,y \in X\)에 대해, \(p_C(x) < \alpha ,\) \(p_C(y) < \beta\)를 만족시키는 임의의 \(\alpha ,\) \(\beta\)를 택하고, \(s = \alpha + \beta\)라고 하자. \(p_C\)의 정의에 의해 \(\alpha^{-1}x \in C ,\) \(\beta^{-1}y \in C\)이고, \(C\)가 볼록집합이므로 \[\frac{1}{s}(x + y) = \frac{\alpha}{s}\alpha^{-1}x + \frac{\beta}{s}\beta^{-1}y \in C\] 이다. 따라서 \(p_C(x + y) \leq s\)이고, \(\alpha\)와 \(\beta\)가 임의의 원소이므로, \[p_C(x + y) \leq p_C(x) + p_C(y)\] 이다. 그러므로 \(p_C\)는 부분선형이다.
이제 \(C\)가 적당한 \(\delta > 0\)에 대해 열린공 \(B_0(\delta)\)를 포함하므로, \(p_C\)의 정의에 의하여 다음이 성립한다. \[\lVert z \rVert < \delta \quad\Rightarrow\quad z \in C \quad\Rightarrow\quad |p_C(z)| \leq 1 .\] 한편 \(z = \frac{1}{2}\delta x/\lVert x \rVert\)라고 두면 (4)를 얻는다.
끝으로 \(x \in C\)라고 가정하자. \(C\)가 열린집합이므로 적당한 \(\alpha < 1\)이 존재하여 \(\alpha^{-1}x \in C\)이고, 따라서 \(p_C(x) \leq \alpha < 1\)이다. 반면에, \(p_C(x) < 1\)이라면 적당한 \(\alpha < 1\)에 대하여 \(\alpha^{-1}x \in C\)이고, \(0 \in C\)이며, \(C\)가 볼록하므로, \(x = \alpha(\alpha^{-1}x) + (1 - \alpha)0 \in C\)이다. 따라서 (3)이 성립한다.
정리 7. (분리 정리)
\(X\)가 실노름공간이거나 복소노름공간이고 \(A \subset X\)와 \(B \subset X\)가 공집합이 아니며 서로소인 볼록집합이라고 하자.
- \(A\)가 열린집합이면 \(f \in X'\)와 \(\gamma \in \mathbb{R}\)이 존재하여, 임의의 \(a\in X\)와 \(b\in B\)에 대하여 \[\Re f(a) < \gamma \leq \Re f(b) \tag{5}\] 를 만족시킨다.
- \(A\)가 컴팩트이고 \(B\)가 닫힌집합이면 \(f \in X'\)와 \(\delta > 0\)이 존재하여, 임의의 \(a\in A\)와 \(b\in B\)에 대하여 \[\Re f(a) \leq \gamma - \delta < \gamma + \delta \leq \Re f(b)\tag{6}\] 를 만족시킨다.
증명
실노름공간에 대한 경우만 증명해도 충분하다.
- \(a_0 \in A\), \(b_0 \in B\)를 택하고, \(w_0 = b_0 - a_0\)이고, \(C = w_0 + A - B\)라고 하자. 그러면 \(C\)는 \(0\)을 원소로 갖는 열린 볼록집합이므로, 민콥스키 범함수 \(p_C\)가 잘 정의되며, 이 범함수는 부분선형이 된다. 또한 \(A\)와 \(B\)가 서로소이므로 \(w_0 \not\in C\)이고, 따라서 (3)에 의해, \(p_C(w_0) \geq 1\)이다.
\(W = \operatorname{Sp} \{w_0\}\)이라고 하고, \(W\)에서 선형범함수 \(f_W\)를 \(\alpha \in \mathbb{R}\)에 대하여 \(f_W(\alpha w_0) = \alpha\)라고 정의하자. \(\alpha \geq 0\)이면 \[f_W(\alpha w_0) \leq \alpha p_C(w_0) = p_C(\alpha w_0)\] 이고, \(\alpha < 0\)이면 \[f_W(\alpha w_0) < 0 \leq p_C(\alpha w_0)\] 이다. 따라서 \(f_W\)는 (1)을 만족시키고, 한-바나흐 정리에 의해, \(f_W\)는 (2)를 만족시키는 \(X\)에서의 확장함수 \(f\)를 가진다. 이 결과와 (4)와 부등식 \[-p(-x) \le -f_X (-x) = f_X (x) \le p(x)\] 를 결합하면 \(f \in X'\)이라는 결론을 얻는다.
이제 임의의 \(a \in A\), \(b \in B\)에 대하여 \(w_0 + a - b \in C\)이므로 보조정리 6에 의하여 \[1 + f(a) - f(b) = f(w_0 + a - b) \leq p(w_0 + a - b) < 1\] 이다. 따라서 \(\gamma = \inf\{f(b) \,\vert\, b \in B\}\)라고 정의하면 다음을 얻는다. \[f(a) \leq \gamma \leq f(b), \quad a \in A,\,b \in B. \tag{7}\] 이 부등식으로부터 (5)를 얻기 위하여 \(f(a) = \gamma\)를 만족하는 \(a \in A\)가 있다고 가정하자. \(A\)가 열린집합이므로 충분히 작은 \(\delta > 0\)이 존재하여 \(a + \delta w_0 \in A\)이고, 따라서 \[f(a + \delta w_0) = f(a) + \delta f_W(w_0) = \gamma + \delta > \gamma\] 이다. 이것은 (7)에 모순이다. 따라서 (5)가 성립한다. - 가정으로부터 \[\epsilon = \frac{1}{4}\inf\{\lVert a - b \rVert : a \in A,\,b \in B\} > 0\] 임을 확인할 수 있다. 이제 \[A_{\epsilon} = A + B_{\epsilon}(0), \quad B_{\epsilon} = B + B_{\epsilon}(0)\] 이라고 하자. \(A_{\epsilon}\)과 \(B_{\epsilon}\)은 열린 볼록집합이고 \(A_{\epsilon} \cap B_{\epsilon} = \emptyset\)이다. 따라서 \(A\), \(B\)를 \(A_{\epsilon}\), \(B_{\epsilon}\)으로 대체하면 (5)가 성립한다. 이제 \(\delta = \frac{1}{2}\epsilon/\lVert w_0 \rVert\)이라 하자. 그러면, 임의의 \(a \in A\)에 대해 \(a + \delta w_0 \in A_{\epsilon}\)이고, 따라서 \[f(a) = f(a + \delta w_0) - \delta f_W(w_0) \leq \gamma - \delta\] 이다. 마찬가지로 임의의 \(b\in B\)에 대하여 \(\gamma + \delta \leq f(b)\)이다. 그러므로 (6)이 성립한다.
실벡터공간의 경우에서 분리 정리의 기하학적인 해석을 살펴보기 위하여 몇 가지 용어를 도입하자.
정의 8. (초평면)
\(X\)가 벡터공간이라고 하자. \(X\)에서의 초평면이란 \(H = x_0 + \operatorname{Ker} h \subset X\) 형태의 집합이다. 여기서 \(h\)는 \(X\)에서의 \(0\)이 아닌 선형범함수이다. \(H\)는 \(H = h^{-1}(\gamma)\)와 같은 등식으로도 정의할 수 있는데, 여기서 \(\gamma = h(x_0)\)이다.
\(\mathbb{R}^n\)에서의 초평면은 \(n-1\) 차원 평면, 즉 \(\mathbb{R}^n\)에서 \(n\)보다 작은 최대 차원을 가진 평면이다. 이것으로부터 무한차원 공간 \(X\)에서 초평면 개념의 기하학적 아이디어를 얻을 수 있다. 다음 정리는 초평면의 극대성을 더 정확하게 기술한다.
\(0 \in X\)를 지나는 초평면은 \(H = \operatorname{Ker} h\) 형태의 부분벡터공간이라는 사실을 염두에 두고 정리를 살펴보자.
정리 9. (초평면의 조건)
\(X\)가 벡터공간이고 \(W\)가 \(X\)의 부분벡터공간이라고 하자. 그러면 \(W\)가 \(0\)을 지나는 초평면이기 위한 필요충분조건은 \(W \neq X\)이면서 임의의 \(y \in X \setminus W\)에 대해 \(X = W \oplus \operatorname{Sp} \{y\}\)인 것이다.
증명
\(W = \operatorname{Ker} h\)가 \(0\)을 지나는 초평면이라고 가정하자. \(h\)는 영함수가 아니므로, \(h(z) \neq 0\)인 \(z \in X\)가 존재한다. 즉 \(z \in X \setminus W\)이고, 따라서 \(W \neq X\)이다. 이제, \(y \in X \setminus W\)가 임의로 주어졌다고 하자. 그러면 \(W\)의 정의에 의하여 \(h(y) \neq 0\)이다. 이제 임의의 \(x \in X\)에 대하여 \(\beta = h(x)/h(y)\)라고 두고, \(x\)를 \[x = x - \beta y + \beta y\] 와 같이 나타내자. 명백하게 \(h(x - \beta y) = 0\)이므로 \(x - \beta y \in W\)이며, 이로부터 \(X = W \oplus \operatorname{Sp} \{y\}\)를 얻는다. 왜냐하면 \(W \cap \operatorname{Sp} \{y\} = \{0\}\)이기 때문이다.
이제 \(X = W \oplus \operatorname{Sp} \{y\}\)를 만족시키는 적당한 \(y \in X\)가 존재한다고 가정하자. 우리는 \(X\)에서 범함수 \(h\)를 정의할 수 있다. 즉, 임의의 \(x \in X\)는 \(x = w + \alpha y\) 형태로 쓸 수 있고, 여기서 \(w \in W ,\) \(\alpha \in \mathbb{F}\)이므로, \(h(x) = \alpha\)로 정의할 수 있다. \(h\)가 \(0\)이 아닌 선형범함수이고 \(W = \operatorname{Ker} h\)임은 명백하다. 따라서 \(W\)는 \(0\)을 지나는 초평면이다.
이제 \(X\)가 노름공간이고 \(H\)가 초평면이라고 가정하자. 그러면, \(H\)는 조밀하거나 \(h \in X'\)이다. (후자의 경우 \(H\)는 닫혀 있다.) 조밀한 집합은 앞서 언급한 초평면의 기하학적 아이디어에 부합하지 않으므로, 우리는 닫힌 초평면을 살펴보자.
이제 분리 정리의 기하학적 의미를 기술할 수 있다. \(X\)가 실벡터공간이고 \(A,\) \(B\)가 정리의 가정을 만족시키는 볼록집합이면, \(A\)와 \(B\)를 분리하는 닫힌초평면 \(H\)가 존재한다. 즉, \(A\)와 \(B\)는 \(x \in A\)에 대해 \(h(x) \leq \gamma\)이고 \(x \in B\)에 대해 \(h(x) \geq \gamma\)가 되도록 \(H\)의 반대편에 있다.
볼록집합에 대한 또 다른 흥미로운 기하학적 결과를 다음 정리에서 살펴보자.
따름정리 10.
\(X\)가 실노름공간이고, \(A \subset X\)가 공집하비 아니고 열린 볼록집합이며, \(b\)가 \(A\)의 경계에 있다고 가정하자. 그러면 임의의 \(a \in A\)에 대해 \(h(a) < h(b)\)를 만족시키는 \(h \in X'\)가 존재한다.
기하학적으로, 따름정리 10는 \(A\)가 “엄격하게 \(H\)의 한쪽에 있도록” \(b\)를 지나는 닫힌초평면 \(H\)가 존재한다고 말한다. \(A\)의 경계가 매끄럽다면, \(H\)는 ‘접선’ 평면으로 간주될 수 있지만, 이 정리는 매끄럽다는 가정을 하지 않는다. ‘모서리’에서는 많은 초평면 \(H\)가 있을 수 있다.