연속선형연산자의 노름

by LY4I
23 views

\(X\)와 \(Y\)가 노름공간일 때 \(B(X,\,Y)\)는 벡터공간이다. 이 글에서는 \(B(X,\,Y)\)가 노름공간임을 보일 것이다. 이를 위해 세 가지 서로 다른 노름을 동시에 다루게 되는데, 원칙적으로는 이 세 노름을 구별해야 한다. 실제로는 원소가 어느 공간에 속하는지 쉽게 알 수 있으므로, 세 노름을 같은 기호 \(\|\cdot\|\)로 나타내어도 어떤 노름을 참조하는지 알 수 있다.

연산자의 노름을 정의하기에 앞서, 다음 등식이 성립함을 상기하자. \[\sup\{\|T(x)\| \,\vert\, \|x\| \leq 1\} = \inf\{k \,\vert\, \|T(x)\| \leq k\|x\| \text{ for all } x \in X\}.\] 특히 모든 \(y \in X\)에 대해 \[\|T(y)\| \leq \sup\{\|T(x)\| \,\vert\, \|x\| \leq 1\}\|y\|\]이다.

보조정리 1. (연산자노름의 정의)

\(X\)와 \(Y\)를 노름공간이라 하자. \(\|\cdot\|: B(X,\,Y) \rightarrow \mathbb{R}\)을

\[\|T\| = \sup\{\|T(x)\| \,\vert\, \|x\| \leq 1\}\]

이라고 정의하면 \(\|\cdot\|\)은 \(B(X,\,Y)\)의 노름이다.

증명

\(S,\,T \in B(X,\,Y)\)이고 \(\lambda \in F\)라 하자.

  1. 명백히 임의의 \(T \in B(X,\,Y)\)에 대하여 \(\|T\| \geq 0\)이다.
  2. 영선형변환 \(R\)은 모든 \(x \in X\)에 대해 \(R(x) = 0\)을 만족시킨다. 따라서 다음 관계가 성립한다. \[\begin{aligned} \|T\| = 0 \quad & \Leftrightarrow \quad \|Tx\| = 0 \text{ for all } x \in X \\[6pt] & \Leftrightarrow \quad Tx = 0 \text{ for all } x \in X \\[6pt] & \Leftrightarrow \quad T \text{ is the zero linear transformation .} \end{aligned}\]
  3. \(\|T(x)\| \leq \|T\|\|x\|\)이므로 모든 \(x \in X\)에 대해 \[\|(\lambda T)(x)\| \leq |\lambda|\|T\|\|x\|\]이다. 따라서 \[\|\lambda T\| \leq |\lambda|\|T\|\] 이다. \(\lambda = 0\)이면 \(\|\lambda T\| = |\lambda| \|T\|\)이고, \(\lambda \neq 0\)이면 \[\|T\| = \|\lambda^{-1}\lambda T\| \leq |\lambda^{-1}| \|\lambda T\| \leq |\lambda^{-1}||\lambda|\|T\| = \|T\|\] 이다. 따라서 \(\|T\| = |\lambda^{-1}| \|\lambda T\|\)이므로 \(\|\lambda T\| = |\lambda| \|T\|\)이다.
  4. 마지막으로 삼각부등식을 확인해야 한다. \[\begin{aligned} \|(S + T)(x)\| &\leq \|S(x)\| + \|T(x)\| \\[6pt] &\leq \|S\|\|x\| + \|T\|\|x\| \\[6pt] &= (\|S\| + \|T\|)\|x\|. \end{aligned}\] 따라서 \(\|S + T\| \leq \|S\| + \|T\|\)이다.

이로써 \(B(X,\,Y)\)가 노름공간임을 밝혔다.

정의 2. (연속선형연산자의 노름)

\(X\)와 \(Y\)를 노름공간이라 하고 \(T \in B(X,\,Y)\)라 하자. \(T\)의 노름을 다음과 같이 정의한다. \[\|T\| = \sup\{\|T(x)\| \,\vert\, \|x\| \leq 1\} .\]

유한차원 공간 사이의 선형변환과 행렬 사이의 관계를 사용하면, 연속선형변환의 노름의 정의를 통해 \(m \times n\) 행렬의 벡터공간에 노름을 부여할 수 있다.

정의 3. (행렬의 노름)

\(\mathbb{F}^p\)가 표준노름을 가지고 있고 \(A\)가 \(\mathbb{F}\)의 원소를 성분으로 갖는 \(m \times n\) 행렬이라 하자. \(T: \mathbb{F}^n \rightarrow \mathbb{F}^m\)이 \(T(x) = Ax\)로 정의되는 연속선형변환이라면, 행렬 \(A\)의 노름은 \(\|A\| = \|T\|\)로 정의된다.

이제 연속선형변환의 노름을 계산하는 방법을 살펴보자. 연산자의 노름은 집합의 상한이기 때문에, 노름을 찾기가 때때로 어려울 수 있다. \(X\)가 유한차원 노름공간이고 \(\|y\| = 1\)인 \(y \in X\)가 존재하여 \[\|T\| = \sup\{\|T(x)\| \,\vert\, \|x\| \leq 1\} = \|T(y)\|\]인 경우에도, 이러한 원소 \(y\)를 찾는 것이 쉽지 않을 수 있다. 무한차원의 경우, 상한이 집합에 속하지 않을 수도 있다. 따라서 연속선형변환의 노름을 찾기 위한 일반적인 절차는 없다. 그럼에도 불구하고 노름을 쉽게 찾을 수 있는 경우가 있다. 다음 보기를 보자.

보기 4. (함숫값연산자의 노름)

\(T: C([0,\,1],\,\mathbb{F}) \rightarrow \mathbb{F}\)가 \(T(f) = f(0)\)으로 정의되는 연속선형연산자라면 \(\|T\| = 1\)이다.

풀이

앞에서 임의의 \(f \in C([0,\,1],\,\mathbb{F})\)에 대해 \(|T(f)| \leq \|f\|\)임을 보였다. 따라서 \[\|T\| = \inf\{k \,\vert\, \|T(x)\| \leq k\|x\| \text{ for all } x \in X\} \leq 1\] 이다. 한편, \(g: [0,1] \rightarrow C\)를 모든 \(x \in X\)에 대해 \(g(x) = 1\)로 정의하면, \(g \in C([0,\,1],\, \mathbb{C})\)이고 \[\|g\| = \sup\{|g(x)| \,\vert\, x \in [0,\,1]\} = 1\]이며 \(|T(g)| = |g(0)| = 1\)이다. 따라서 \[1 = |T(g)| \leq \|T\|\|g\| = \|T\|\]이므로 \(\|T\| = 1\)이다.

때로는 한 연산자의 노름을 사용하여 다른 연산자의 노름을 찾을 수 있다. 다음 정리에서 이 사실을 살펴보자.

정리 5. (연속선형연산자의 확장)

\(X\)가 노름공간이고 \(W\)가 \(X\)의 조밀한 부분공간이라고 하자. 또한 \(Y\)가 바나흐 공간이고 \(S \in B(W,\,Y)\)라고 하자.

  1. \(x \in X\)이고 \(\{x_n\}\)과 \(\{y_n\}\)이 \[\lim_{n \to \infty} x_n = \lim_{n \to \infty} y_n = x\]인 \(W\)의 수열이라면, \(\{S(x_n)\}\)과 \(\{S(y_n)\}\)은 모두 수렴하고 \[\lim_{n \to \infty} S(x_n) = \lim_{n \to \infty} S(y_n)\]이다.
  2. \(T \in B(X,\,Y)\)가 존재하여, \(\|T\| = \|S\|\)이고 모든 \(x \in W\)에 대해 \(Tx = Sx\)를 만족시킨다.

증명

  1. \(\{x_n\}\)은 수렴하므로 코시 수열이다. 그런데 \[\|S(x_n) - S(x_m)\| = \|S(x_n - x_m)\| \leq \|S\|\|x_n - x_m\|\] 이므로 \(\{S(x_n)\}\)도 코시 수열이며, \(Y\)가 바나흐 공간이므로 \(\{S(x_n)\}\)은 수렴한다. 즉 적당한 \(x\)에 대하여 \[\lim_{n \to \infty} x_n = \lim_{n \to \infty} y_n = x\] 이므로 \[\lim_{n \to \infty} (x_n - y_n) = 0\]이다. 그리고 \[\|S(x_n) - S(y_n)\| = \|S(x_n - y_n)\| \leq \|S\|\|x_n - y_n\|\] 이며 \[\lim_{n \to \infty} S(x_n) - S(y_n) = 0\] 이므로 \[\lim_{n \to \infty} S(x_n) = \lim_{n \to \infty} S(y_n)\]이다.
  2. \(T: X \rightarrow Y\)를 정의하자. 임의의 \(x \in X\)에 대하여, \(W\)가 \(X\)에서 조밀하므로 \[\lim_{n \to \infty} x_n = x\] 인 \(W\)의 수열 \(\{x_n\}\)이 존재하고, 이때 \[T(x) = \lim_{n \to \infty} S(x_n)\] 이라고 정의한다. 이와 같이 정의된 \(T\)는 (a)에 의해 수열 \(\{x_n\}\)의 선택에 독립적이다.
    \(T\)가 선형변환임을 보이자. \(x,\,y \in X\)이고 \(\lambda \in \mathbb{F}\)라고 하자. \[\lim_{n \to \infty} x_n = x , \quad \lim_{n \to \infty} y_n = y\] 인 \(W\)의 수열 \(\{x_n\}\)과 \(\{y_n\}\)을 생각하자. 그러면 \(\{x_n\}\)과 \(\{y_n\}\)은 \[\lim_{n \to \infty} (x_n + y_n) = x + y\] 이고 \[\lim_{n \to \infty} \lambda x_n = \lambda x\] 인 \(W\)의 수열이다. 따라서 \[\begin{aligned} T(x + y) &= \lim_{n \to \infty} S(x_n + y_n) \\[6pt] &= \lim_{n \to \infty} (S(x_n) + S(y_n)) \\[6pt] &= \lim_{n \to \infty} S(x_n) + \lim_{n \to \infty} S(y_n) = T(x) + T(y) \end{aligned}\] 그리고 \[\begin{aligned} T(\lambda x) &= \lim_{n \to \infty} S(\lambda x_n) \\[6pt] &= \lim_{n \to \infty} \lambda S(x_n) \\[6pt] &= \lambda \lim_{n \to \infty} S(x_n) = \lambda T(x) \end{aligned}\] 이다. 따라서 \(T\)는 선형변환이다.
    이제 \(\|x\| = 1\)인 \(x \in X\)가 임의로 주어졌다고 하고, \(\lim_{n \to \infty} x_n = x\)인 \(W\)의 수열 \(\{x_n\}\)을 생각하자. \[\lim_{n \to \infty} x_n = x = 1\]이므로, \[w_n = \frac{x_n}{\|x_n\|}\]이라고 정의하면 \(\{w_n\}\)은 \[\lim_{n \to \infty} w_n = \lim_{n \to \infty} \frac{x_n}{\|x_n\|} = x\]를 만족시키고, 모든 \(n \in \mathbb{N}\)에 대해 \[\|w_n\| = \frac{\|x_n\|}{\|x_n\|} = 1\]인 \(W\)의 수열이다. 그리고 \[\begin{aligned} \|Tx\| &= \lim_{n \to \infty} \|Sw_n\| \leq \sup\{\|Sw_n\| \,\vert\, n \in \mathbb{N}\} \\[6pt] &\leq \sup\{\|S\|\|w_n\| \,\vert\, n \in \mathbb{N}\} = \|S\| \end{aligned}\] 이므로, \(T\)는 유계이고 \(\|T\| \leq \|S\|\)이다. 또한 \(w \in W\)이면 상수수열 \(\{w\}\)는 \(w\)로 수렴하는 \(W\)의 수열이므로 \[Tw = \lim_{n \to \infty} Sw = Sw\] 이다. 따라서 \[\|Sw\| = \|Tw\| \leq \|T\|\|w\|\]이므로 \(\|S\| \leq \|T\|\)이다. 그러므로 \(\|S\| = \|T\|\)이다. 또한 \(x \in W\)일 때 \(Tx = Sx\)라는 사실을 보였다.

정리 5의 연산자 \(T\)는 연산자 \(S\)를 더 큰 공간 \(X\)로 확장한 것으로 볼 수 있다.

이제 노름을 쉽게 찾을 수 있는 연산자 유형을 살펴보자.

정의 6. (등거리변환)

\(X\)와 \(Y\)가 노름공간이고 \(T \in L(X,\,Y)\)라고 하자. 만약 임의의 \(x \in X\)에 대하여 \(\|T(x)\| = \|x\|\)이면, \(T\)를 등거리변환(isometry)이라고 부른다.

모든 노름공간에는 적어도 하나의 등거리변환이 있다.

보기 7. (등거리변환으로서의 항등변환)

\(X\)가 노름공간이고 \(I\)가 \(X\) 위의 항등변환이면, \(I\)는 등거리변환이다.

풀이

\(x \in X\)이면 \(I(x) = x\)이므로 \(\|I(x)\| = \|x\|\)이다. 따라서 \(I\)는 등거리변환이다.

등거리변환의 다른 예로 다음 선형변환을 살펴보자.

보기 8. (단방향이동 연산자)

  1. \(x = (x_1,\,x_2,\,x_3,\,\ldots) \in \ell^2\)이면 \(y = (0,\,x_1,\,x_2,\,x_3,\,\ldots) \in \ell^2\)이다.
  2. 선형변환 \(S: \ell^2 \rightarrow \ell^2\)를 \[S(x_1,\,x_2,\,x_3,\,\ldots) = (0,\,x_1,\,x_2,\,x_3,\,\ldots)\]이라고 정의하면 \(S\)는 등거리변환이다.

풀이

  1. \(x \in \ell^2\)이므로 \[\begin{aligned} |0|^2 + |x_1|^2 & + |x_2|^2 + |x_3|^2 + \ldots \\[6pt] &= |x_1|^2 + |x_2|^2 + |x_3|^2 + \ldots < \infty\end{aligned}\] 이다. 따라서 \(y \in \ell^2\)이다.
  2. 마찬가지로 \[\begin{aligned} \|S(x)\|_2^2 &= |0|^2 + |x_1|^2 + |x_2|^2 + |x_3|^2 + \ldots \\[6pt] &= |x_1|^2 + |x_2|^2 + |x_3|^2 + \ldots = \|x\|_2^2\end{aligned}\] 이므로, \(S\)는 등거리변환이다.

보기 8에서 살펴본 연산자 \(S:\ell^2 \rightarrow \ell^2\)을 단방향이동 연산자(unilateral shift)라고 부른다.

단방향이동은 \(\ell^2\)를 \(\ell^2\) 위로 대응시키지 않는다. (즉 전사함수가 아니다.) 이는 유한차원 상황과 대조적이다. 유한차원에서는 \(X\)가 노름공간이고 \(T\)가 \(X\)에서 \(X\)로의 등거리변환이면 \(T\)는 \(X\)를 \(X\) 위로 대응시킨다.

다음 정리는 등거리변환의 노름이 \(1\)임을 보여준다.

정리 9. (등거리변환의 노름)

\(X\)와 \(Y\)를 노름공간이라 하고 \(T \in L(X,\,Y)\)라 하자. \(T\)가 등거리변환이면 \(T\)는 유계이고 \(\|T\| = 1\)이다.

정리 9의 역은 성립하지 않는다. 보기 4에서 \(\|T\| = 1\)이지만 모든 \(h \in C_F[0,\, 1]\)에 대해 \(|T(h)| = \|h\|\)는 아니다. 예를 들어, \(h: [0, 1] \rightarrow F\)를 모든 \(x \in [0, 1]\)에 대해 \(h(x) = x\)로 정의하면 \(\|h\| = 1\)이지만 \(|T(h)| = 0\)이다. 따라서 선형변환이 등거리변환이라고 말하는 것은 그것의 노름이 \(1\)이라고 하는 것보다 더 강한 조건이다.

정의 10. (등거리동형)

\(X\)와 \(Y\)가 노름공간이고 \(T\)가 \(X\)에서 \(Y\) 위로(onto)의 등거리변환이면, \(T\)를 등거리동형사상이라고 부르고 “\(X\)와 \(Y\)가 등거리동형이다”라고 말한다.

두 공간이 등거리동형이라는 것은 두 공간이 벡터공간으로서 동일한 구조와 노름공간으로서 동일한 노름 구조를 가진다는 것을 의미한다.

정리 11. (힐베르트 공간과 \(\ell^2\) 사이의 등거리동형)

\(\mathcal{H}\)가 \(\mathbb{F}\) 위의 정규직교기저 \(\{e_n\}\)을 가진 무한차원 힐베르트 공간이라 하자. 그러면 임의의 \(n \in \mathbb{N}\)에 대해 \(T(e_n) = \tilde{e}_n\)인 \(\mathcal{H}\)에서 \(\ell^2_\mathbb{F}\) 위로의 등거리변환 \(T\)가 존재한다.

증명

\(x \in H\)라 하자. 그러면 \(\{e_n\}\)이 \(H\)의 정규직교기저이므로 의해 \[x = \sum_{n=1}^{\infty} \langle x,\,e_n \rangle e_n\]이다. 또한, \(\alpha_n = \langle x,\,e_n \rangle\)이라고 하면, 베셀의 부등식에 의해 \(\{\alpha_n\} \in \ell^2_\mathbb{F}\)이므로 선형변환 \(T: \mathcal{H} \rightarrow \ell^2_\mathbb{F}\)를 \(T(x) = \{\alpha_n\}\)으로 정의할 수 있다. 이때 다음 등식이 성립한다. \[\|T(x)\|^2 = \sum_{n=1}^{\infty} |\alpha_n|^2 = \sum_{n=1}^{\infty} |\langle x,\,e_n \rangle |^2 = \|x\|^2 .\] 이 등식이 임의의 \(x \in \mathcal{H}\)에 대해 성립하므로, \(T\)는 등거리변환이고, 정의에 의해 임의의 \(n \in \mathbb{N}\)에 대해 \(T(e_n) = \tilde{e}_n\)이다.

끝으로, \(\{\beta_n\} \in \ell^2_\mathbb{F}\)라면 급수 \(\sum_{n=1}^{\infty} \beta_n e_n\)은 \(H\)의 한 점 \(y\)로 수렴한다. \(\langle y,\,e_n \rangle = \beta_n\)이므로 \(T(y) = \{\beta_n\}\)이다. 따라서 \(T\)는 \(\mathcal{H}\)에서 \(\ell^2_\mathbb{F}\) 위로의 등거리변환이다.

따름정리 12. (가분 힐베르트 공간은 \(\ell^2\)와 등거리동형이다)

\(\mathbb{F}\) 위의 무한차원 가분 힐베르트 공간 \(\mathcal{H}\)는 \(\ell^2_\mathbb{F}\)와 등거리동형이다.

증명

\(\mathcal{H}\)가 정규직교기저 \(\{e_n\}\)을 가지므로, 정리 11에 의해 \(\mathcal{H}\)는 \(\ell^2_\mathbb{F}\)와 등거리동형이다.