연속선형변환

by LY4I
29 views

노름공간 자체의 성질만큼이나 중요한 것은 노름공간 사이에서 정의된 함수의 성질이다. 두 벡터공간 사이에서 정의되는 가장 단순한 함수는 벡터공간의 구조를 보존하는 함수, 즉 선형변환이다. 두 벡터공간 \(X\)와 \(Y\)가 있고 \(X\)에서 \(Y\)로의 선형변환을 살펴볼 때, \(X\)와 \(Y\)는 같은 체 위의 벡터공간이라고 간주한다.

노름벡터공간은 노름과 관련된 거리 구조를 가지고 있으므로, 노름벡터공간 사이에서 정의된 함수의 연속성을 생각할 수 있다. 일반적으로 거리공간 사이에서 정의된 함수 중 연속함수가 연속이 아닌 함수보다 더 중요하다. 따라서 노름벡터공간 사이에서 정의된 연속선형변환에 관심을 집중하여 살펴볼 것이다.

연속선형변환의 예를 살펴보기 전에, 선형변환의 연속성에 대한 동치 조건을 살펴보자. 여기서 표기법에 관한 규칙을 명확히 할 필요가 있다. \(X\)와 \(Y\)가 노름공간이고 \(T: X \rightarrow Y\)가 선형변환일 때, \(X\)의 원소의 노름과 \(Y\)의 원소의 노름이 종종 하나의 식에 나타날 수 있다. 따라서 필요한 경우 두 노름을 구별하는 표기법을 사용해야 할 것이다. 그러나 실제로는 맥락상 원소가 어느 공간에 속하는지 쉽게 알 수 있고, 따라서 식에서 사용된 노름이 어떤 공간의 노름인지 암시적으로 알 수 있기 때문에, 노름을 나타낼 때 단순히 \(\|\cdot\|\) 기호를 사용해도 무방하다. 또한, 이미 살펴본 공간의 노름을 명시적으로 언급하지 않고 사용할 때, 이 공간의 노름은 표준노름이라고 가정한다.

정리 1. (선형변환의 연속성에 대한 동치 조건)

\(X\)와 \(Y\)를 노름공간이라 하고 \(T: X \rightarrow Y\)를 선형변환이라고 하자. 이때, 다음은 모두 동치이다.

  1. \(T\)는 균등연속이다.
  2. \(T\)는 연속이다.
  3. \(T\)는 \(0\)에서 연속이다.
  4. 양의 실수 \(k\)가 존재하여, \(x \in X\)이고 \(\|x\| \leq 1\)일 때 \(\|T(x)\| \leq k\)이다.
  5. 양의 실수 \(k\)가 존재하여, 모든 \(x \in X\)에 대하여 \(\|T(x)\| \leq k\|x\|\)이다.

증명

[(a) ⇒ (b)]와 [(b) ⇒ (c)]는 일반적인 상황에서도 성립하므로, 여기서는 [(c) ⇒ (d)], [(d) ⇒ (e)], [(e) ⇒ (a)]를 증명하면 충분하다.

  • [(c) ⇒ (d)] \(T\)가 \(0\)에서 연속이므로, 양수 \(\epsilon = 1\)에 대하여, \(\delta > 0\)이 존재하여, \(x \in X\)이고 \(\|x\| < \delta\)일 때 \(\|T(x)\| < 1\)이다. \(\|w\| \leq 1\)인 \(w \in X\)를 생각하자. \[\left\|\frac{\delta w}{2}\right\| = \frac{\delta}{2} \|w\| \leq \frac{\delta}{2} < \delta\] 이므로 \(\|T((\delta w)/2)\| < 1\)이다. \(T\)가 선형변환이므로 \(T((\delta w)/2) = (\delta/2)T(w)\)이다. 따라서 \((\delta/2)\|T(w)\| < 1\)이고, \(\|T(w)\| < 2/\delta\)이다. 그러므로 \(k = 2/\delta\)일 때 조건 (d)가 성립한다.
  • [(d) ⇒ (e)] \(\|x\| \leq 1\)일 때 \(\|T(x)\| \leq k\)가 성립하는 \(k\)가 있다고 하자. \(T(0) = 0\)이므로 \(\|T(0)\| \leq k\|0\|\)은 자명하다. \(y \in X\)이고 \(y \neq 0\)이라 하자. \(\|y/\|y\|\| = 1\)이므로 \(\|T(y/\|y\|)\| \leq k\)이다. \(T\)가 선형변환이므로 \[\|T(y)\| = \|y\| \cdot \left\|T \left( \frac{y}{\|y\|} \right) \right\| \leq k\|y\|\] 이다. 따라서 모든 \(x \in X\)에 대해 \(\|T(x)\| \leq k\|x\|\)이다.
  • [(e) ⇒ (a)] \(T\)가 선형변환이므로, 모든 \(x,\,y \in X\)에 대해 \[\|T(x) - T(y)\| = \|T(x - y)\| \leq k\|x - y\|\] 이다. \(\epsilon > 0\)이 임의로 주어졌다고 하자. 그리고 \(\delta = \epsilon/k\)라고 하자. \(x,\,y \in X\)이고 \(\|x - y\| < \delta\)이면 \[\|T(x) - T(y)\| \leq k\|x - y\| < k \cdot \frac{\epsilon}{k} = \epsilon\] 이다. 따라서 \(T\)는 균등연속이다.

선형변환이 연속이기 위한 조건을 얻었으므로, 이제 몇 가지 예를 살펴보자. 일반적으로 우리가 관심을 두는 함수가 선형변환임이 분명하므로, 이 글에서는 이 함수가 연속인지 보이는 데에 집중하기로 한다. 선형변환의 연속성을 확인할 때는 주로 위 정리의 조건 (d) 또는 (e)를 사용한다.

보기 2. (점에서의 함숫값은 연속인 함수가 된다)

선형변환 \(T: C([0,\,1] ,\, \mathbb{F} ) \rightarrow \mathbb{F}\)를 \(T(f) = f(0)\)으로 정의하자. 이 변환이 연속임을 보이자.

\(f \in C([0,\,1] ,\, \mathbb{F} )\)라고 하자. 그러면 \[|T(f)| = |f(0)| \leq \sup\{|f(x)| \,\vert\, x \in [0, 1]\} = \|f\|\] 이다. 따라서 \(T\)는 정리 1의 (e)에서 \(k = 1\)인 경우에 해당하므로 연속이다.

선형변환 \(T\)가 연속인지 확인하기 전에, 때로는 \(T\)가 잘 정의되었는지 먼저 확인할 필요가 있다. 다음 정리는 선형변환이 잘 정의되었는지 확인할 때 사용된다.

보조정리 3. (유계수열에 의한 곱셈은 \(\ell^p\)를 보존한다)

\(\{c_n\} \in \ell^\infty\)이고 \(\{x_n\} \in \ell^p\)이며 \(1 \leq p < \infty\)라고 하자. 그러면 \(\{c_n x_n\} \in \ell^p\)이고 \[\sum_{n=1}^{\infty} |c_n x_n|^p \leq \|\{c_n\}\|_\infty^p \sum_{n=1}^{\infty} |x_n|^p\] 이다.

증명

\(\{c_n\} \in \ell^\infty\)이고 \(\{x_n\} \in \ell^p\)이므로 \[\lambda = \|\{c_n\}\|_\infty = \sup\{|c_n| : n \in \mathbb{N}\} < \infty\] 이고 \(\sum_{n=1}^{\infty} |x_n|^p < \infty\)이다.

모든 \(n \in \mathbb{N}\)에 대해 \(|c_n x_n|^p \leq \lambda^p |x_n|^p\)이므로, 비교 판정법에 의하여 \(\sum_{n=1}^{\infty} |c_n x_n|^p\)이 수렴한다. 따라서 \(\{c_n x_n\} \in \ell^p\)이고, 정리의 부등식도 성립한다.

보기 4. (\(\ell^1\)에서 \(\mathbb{F}\)로의 연속선형변환)

\(\{c_n\} \in \ell^\infty\)라 하자. 선형변환 \(T: \ell^1 \rightarrow F\)를 \[T(\{x_n\}) = \sum_{n=1}^{\infty} c_n x_n\] 으로 정의하자. 이 변환이 연속임을 보이자.

보조정리 3에 의해 \(\{c_n x_n\} \in \ell^1\)이므로, \(T\)는 잘 정의되어 있다. 또한 다음이 성립한다. \[\begin{aligned} |T(\{x_n\})| &= |\sum_{n=1}^{\infty} c_n x_n| \leq \sum_{n=1}^{\infty} |c_n x_n| \\[6pt] &\leq \|\{c_n\}\|_\infty \sum_{n=1}^{\infty} |x_n| = \|\{c_n\}\|_\infty \|\{x_n\}\|_1. \end{aligned}\]

따라서 \(T\)는 정리 1의 조건 (e)에서 \(k = \|\{c_n\}\|_\infty\)인 경우에 해당하므로 연속이다.

보기 5. (\(\ell^2\)에서의 연속선형변환)

\(\{c_n\} \in \ell^\infty\)라 하자. 선형변환 \(T: \ell^2 \rightarrow \ell^2\)를 \[T(\{x_n\}) = \{c_n x_n\}\]으로 정의하자. 이 변환이 연속임을 보이자.

\(\lambda = \|\{c_n\}\|_\infty\)라 하자. 보조정리 3에 의하여 \(\{c_n x_n\} \in \ell^2\)이므로, \(T\)는 잘 정의되어 있다. 또한 다음이 성립한다. \[\|T(\{x_n\})\|_2^2 = \sum_{n=1}^{\infty} |c_n x_n|^2 \leq \lambda^2 \sum_{n=1}^{\infty} |x_n|^2 = \lambda^2 \|\{x_n\}\|_2^2.\] 따라서 \(T\)는 정리 1의 조건 (e)에서 \(k = \|\{c_n\}\|_\infty\)인 경우에 해당하므로 연속이다.

정리 1의 조건 (e)를 만족시키는 함수는 자주 사용되므로 다음과 같은 이름을 붙여 사용한다.

정의 6. (유계선형변환)

\(X\)와 \(Y\)를 노름공간이라 하고 \(T: X \rightarrow Y\)를 선형변환이라 하자. 만약 양의 실수 \(k\)가 존재하여 모든 \(x \in X\)에 대해 \(\|T(x)\| \leq k \|x\|\)를 만족시키면, \(T\)를 유계선형변환(bounded linear transformation)이라고 부른다.

정리 1에 의하면, 선형변환에 대해서 “연속”과 “유계”라는 용어를 서로 바꿔 사용할 수 있다. 그러나 이는 실수에서 실수로의 함수에 사용되는 “유계”라는 단어와는 다른 의미이다. 예를 들어, \(T: \mathbb{R} \rightarrow \mathbb{R}\)이 \(T(x) = x\)로 정의된 선형변환이라고 하면, \(T\)는 정의 6에서 정의한 “유계선형변환”이지만, 당연히 유계인 함수의 일반적인 의미에서는 유계가 아니다. 얼핏 보면 이것은 명백한 용어의 충돌처럼 보이지만, 사실 이것은 심각한 문제가 아니다. 왜냐하면, 영벡터로 정의된 상수인 선형변환을 제외하면, 선형변환은 유계인 함수의 일반적인 의미에서 결코 유계가 아니기 때문이다. 즉 어느 경우에든 “유계”라는 용어가 무엇을 보여야 하는지 명백하게 드러나기 때문에, 잠재적인 모호함으로 인한 문제는 발생하지 않는다.

\(X\)와 \(Y\)를 노름공간이라 하자. \(X\)에서 \(Y\)로 가는 모든 연속선형변환의 집합을 \(B(X,\,Y)\)로 표기한다. \(B(X,\,Y)\)의 원소를 유계선형변환 또는 연속선형변환 또는 때로는 단순히 연산자라고 부른다.

명백히, \(X\)와 \(Y\)가 노름공간이면 \(B(X,\,Y) \subseteq L(X,\,Y)\)이다.

보기 7. (연속핵을 가진 적분변환)

\(a, b \in \mathbb{R}\)이고, \(k: [a, b] \times [a, b] \rightarrow \mathbb{C}\)가 연속인 함수이며, \[M = \sup\{|k(s,\,t)| \,\vert\, (s,\,t) \in [a,\,b] \times [a,\,b]\}\]라고 하자.

  1. \(g \in C[a,\,b]\)일 때, \(f: [a,\,b] \rightarrow \mathbb{C}\)를 \[f(s) = \int_a^b k(s,\,t)g(t)\,dt\]로 정의하면 \(f \in C[a,\,b]\)이다.
  2. 선형변환 \(K: C[a,\,b] \rightarrow C[a,\,b]\)를 \[(K(g))(s) = \int_a^b k(s,\,t)g(t)\,dt\]로 정의하면 \(K \in B(C[a,\,b], C[a,\,b])\)이고 \(\|K(g)\| \leq M(b-a)\|g\|\)이다.

풀이

  1. \(\epsilon > 0\)이고 \(s \in [a,\,b]\)라 하자. \(k_s \in C[a,\,b]\)를 \(k_s(t) = k(s,\,t)\), \(t \in [a,\,b]\)인 함수라고 하자. 정사각형 \([a,\,b] \times [a,\,b]\)는 \(\mathbb{R}^2\)의 컴팩트 부분집합이므로, 함수 \(k\)는 균등연속이고 따라서 \(\delta > 0\)이 존재하여 \(|s - s'| < \delta\)이면 모든 \(t \in [a,\,b]\)에 대해 \(|k_s(t) - k_{s'}(t)| < \epsilon\)이다. 따라서 \[|f(s) - f(s')| \leq \int_a^b |k(s,\,t) - k(s',\,t)||g(t)|\,dt \leq \epsilon(b-a)\|g\|.\] 그러므로 \(f\)는 연속이다.
  2. 모든 \(s \in [a,\,b]\)에 대해, \[|(K(g))(s)| \leq \int_a^b |k(s,\,t)g(t)|\,dt \leq \int_a^b M\|g\|\,dt = M(b-a)\|g\|.\] 따라서 \(\|K(g)\| \leq M(b-a)\|g\|\)이므로 \(K \in B(C[a,\,b], C[a,\,b])\)이다.

보기 7에는 많은 괄호가 있다. 너무 많은 괄호를 사용하는 것을 피하기 위해, \(T \in B(X,\,Y)\)이고 \(x \in X\)일 때, \(T(x)\)를 간단히 \(Tx\)라고 나타내는 것이 일반적이다.

지금까지 제시된 예를 보면 모든 선형변환이 연속이라고 생각할 수도 있다. 그러나 다음 보기에서 보다시피 연속이 아닌 선형변환이 존재한다.

보기 8. (불연속 미분연산자)

\(\mathcal{P}\)를 모든 다항함수로 구성된 \(C([0,\,1],\,\mathbb{C})\)의 부분벡터공간이라 하자. \(T: \mathcal{P} \rightarrow \mathcal{P}\)가 \(T(p) = p'\)로 정의된 선형변환이라 하자. 여기서 \(p'\)은 \(p\)의 도함수이다. 그러면 \(T\)는 연속이 아니다.

풀이

\(p_n \in \mathcal{P}\)를 \(p_n(t) = t^n\)으로 정의하자. 그러면 \[\|p_n\| = \sup\{|p_n(t)| : t \in [0,1]\} = 1\] 이다. 반면에 \[\begin{aligned} \|T(p_n)\| &= \|p'_n\| = \sup\{|p'_n(t)| \,\vert\, t \in [0,1]\} \\[6pt] &= \sup\{|nt^{n-1}| \,\vert\, t \in [0,1]\} = n \end{aligned}\] 이다. 따라서 “모든 \(p \in \mathcal{P}\)에 대해 \(\|T(p)\| \leq k\|p\|\)”를 만족시키는 \(k \geq 0\)이 존재하지 않으므로, \(T\)는 연속이 아니다.

보기 8에서 살펴본 공간 \(\mathcal{P}\)는 유한차원이 아니므로, 유한차원 노름공간 사이의 모든 선형변환이 연속인지에 대한 의문이 생길 수 있다. 그 답을 다음 정리에서 살펴보자.

정리 9. (유한차원 공간 사이의 선형변환은 연속이다)

\(X\)가 유한차원 노름공간이고 \(Y\)가 임의의 노름공간이며 \(T: X \rightarrow Y\)가 선형변환이라고 하자. 그러면 \(T\)는 연속이다.

증명

먼저 \(X\)에 새로운 노름을 정의한다. 이 노름은 원래의 노름과 다를 수 있으므로, 두 노름을 구별하는 표기법을 사용해야 한다. 새로운 노름 \(\|\cdot\|_1: X \rightarrow \mathbb{R}\)을 \(\|x\|_1 = \|x\| + \|T(x)\|\)라고 정의하자.

\(\|\cdot\|_1\)이 \(X\)의 노름임을 보이자. \(x,\,y \in X\)이고 \(\lambda \in F\)라 하자.

  1. \(\|x\|_1 = \|x\| + \|T(x)\| \geq 0\).
  2. \(\|x\|_1 = 0\)이면 \(\|x\| = \|T(x)\| = 0\)이므로 \(x = 0\)이다. 또한 \(x = 0\)이면 \(\|x\| = \|T(x)\| = 0\)이므로 \(\|x\|_1 = 0\)이다.
  3. \(\|\lambda x\|_1 =\)\( \|\lambda x\| + \|T(\lambda x)\| =\)\( |\lambda|\|x\| + |\lambda|\|T(x)\| =\)\( |\lambda|(\|x\| + \|T(x)\|) =\)\( |\lambda|\|x\|_1\).
  4. \(\|x + y\|_1 =\)\( \|x + y\| + \|T(x + y)\| =\)\( \|x + y\| + \|T(x) + T(y)\| \leq\)\( \|x\| + \|y\| + \|T(x)\| + \|T(y)\| =\)\( \|x\|_1 + \|y\|_1 .\)

따라서 \(\|\cdot\|_1\)은 \(X\)의 노름이다.

\(X\)가 유한차원이므로, \(\|\cdot\|\)과 \(\|\cdot\|_1\)은 동치이며, 모든 \(x \in X\)에 대해 \(\|x\|_1 \leq K\|x\|\)를 만족하는 \(K > 0\)이 존재한다. 따라서 모든 \(x \in X\)에 대해 \(\|T(x)\| \leq \|x\|_1 \leq K\|x\|\)이므로 \(T\)는 유계이다.

만약 선형변환의 정의역이 유한차원이면, 정리 9에 의해 그 선형변환은 연속이다. 선형변환의 치역이 유한차원인 경우에는 다음 보기에서 볼 수 있듯이, 선형변환이 반드시 연속인 것은 아니다.

보기 10. (다항식에 대한 불연속 선형범함수)

\(\mathcal{P}\)를 모든 다항함수로 구성된 \(C([0,\,1],\,\mathbb{C})\)의 부분벡터공간이라 하자. \(T: \mathcal{P} \rightarrow \mathbb{C}\)가 \(T(p) = p'(1)\)이라고 정의된 선형변환이라고 하자. 여기서 \(p'\)은 \(p\)의 도함수이다. 그러면 \(T\)는 연속이 아니다.

선형변환이 연속인지 결정하는 방법을 살펴보았으므로, 연속선형변환의 몇 가지 기본적인 성질을 살펴보자. 여기서 유한차원 벡터공간 사이의 선형변환과 행렬 사이의 관계가 매우 유용할 수 있지만, 무한차원 공간 사이의 선형변환은 행렬로 다루기가 쉽지 않다. 무한차원 공간의 기저와 무한 크기의 행렬 모두 다루기가 어렵기 때문이다. 따라서 우리는 유한차원 벡터공간 사이의 선형변환의 행렬 표현만 사용할 것이다.

보조정리 11. (연속선형변환의 핵은 닫혀 있다)

\(X\)와 \(Y\)가 노름공간이고 \(T: X \rightarrow Y\)가 연속선형변환이라고 하자. 그러면 \(\operatorname{ker}(T)\)는 닫혀있다.

증명

\(T\)가 연속이고, \[\operatorname{ker}(T) = \{x \in X \,\vert\, T(x) = 0\}\]이며, \(\{0\}\)이 \(Y\)에서 닫혀있으므로, \(\operatorname{ker}(T)\)는 닫혀있다.

\(X\)와 \(Y\)가 노름공간이면 데카르트곱 \(X \times Y\)도 노름공간이다. 그러므로 다음과 같은 정의를 도입할 수 있다.

정의 12. (선형변환의 그래프)

\(X\)와 \(Y\)가 노름공간이고 \(T: X \rightarrow Y\)가 선형변환이라고 하자. 이때 \(T\)의 그래프는 다음과 같이 정의된 \(X \times Y\)의 부분벡터공간 \(\mathcal{G}(T)\)이다. \[\mathcal{G}(T) = \{(x, Tx) \,\vert\, x \in X\} .\]

보조정리 13. (연속선형변환의 그래프는 닫혀 있다)

\(X\)와 \(Y\)가 노름공간이고 \(T: X \rightarrow Y\)가 연속선형변환이라고 하자. 그러면 \(\mathcal{G}(T)\)는 닫혀있다.

증명

\(\mathcal{G}(T)\)에서 \((x,\,y) \in X \times Y\)로 수렴하는 수열 \(\{(x_n,\,y_n)\}\)이 있다고 하자. 그러면 \(\{x_n\}\)은 \(X\)에서 \(x\)로 수렴하고 \(\{y_n\}\)은 \(Y\)에서 \(y\)로 수렴한다. 그러나 \((x_n,\,y_n) \in \mathcal{G}(T)\)이므로 모든 \(n \in \mathbb{N}\)에 대해 \(y_n = T(x_n)\)이다. \(T\)가 연속이므로, \[y = \lim_{n \to \infty} y_n = \lim_{n \to \infty} T(x_n) = T(x)\] 이다. 그러므로 \((x,\,y) = (x,\,T(x)) \in \mathcal{G}(T)\)이고, 따라서 \(\mathcal{G}(T)\)는 닫혀있다.

끝으로 \(X\)와 \(Y\)가 노름공간일 때 집합 \(B(X,\,Y)\)가 벡터공간임을 살펴보자. 이는 \(B(X,\,Y)\)가 \(L(X,\,Y)\)의 부분벡터공간임을 보임으로써 이루어질 것이다.

정리 14. (\(B(X,\,Y)\)는 벡터공간이다)

\(X\)와 \(Y\)가 노름공간이고, \(S,\,T \in B(X,\,Y)\)이며, 모든 \(x \in X\)에 대해 \(\|S(x)\| \leq k_1 \|x\|\)이고 \(\|T(x)\| \leq k_2 \|x\|\)라고 하자. 또한 \(\lambda \in F\)라 하자. 그러면 다음이 성립한다.

  1. 임의의 \(x \in X\)에 대해 \(\|(S + T)(x)\| \leq (k_1 + k_2)\|x\|\)이다.
  2. 임의의 \(x \in X\)에 대해 \(\|(\lambda S)(x)\| \leq |\lambda|k_1 \|x\|\)이다.
  3. \(B(X,\,Y)\)는 \(L(X,\,Y)\)의 부분벡터공간이다.

증명

  1. \(x \in X\)이면 \[\begin{aligned} \|(S + T)(x)\| &\leq \|S(x)\| + \|T(x)\| \\[6pt] &\leq k_1\|x\| + k_2\|x\| \\[6pt] &= (k_1 + k_2)\|x\|. \end{aligned}\]
  2. \(x \in X\)이면 \[(\lambda S)(x) = |\lambda|\|S(x)\| \leq |\lambda|k_1\|x\|.\]
  3. (a)와 (b)에 의해, \(S + T\)와 \(\lambda S\)는 \(B(X,\,Y)\)에 속하므로, \(B(X,\,Y)\)는 \(L(X,\,Y)\)의 부분벡터공간이다.