선형대수학 리뷰

by Ariel Daley

이 포스트에서는 수학의 다양한 분야를 공부하기 위해 필요한 선형대수학 내용을 간략하게 살펴봅니다.

벡터공간

벡터공간의 뜻

\(\mathbb{F}\)가 체(field)이고, \(V\)가 공집합이 아닌 집합라고 하자. \(V\)가 \(\mathbb{F}\) 위에서의 벡터공간(vector space)이라 함은, 벡터 합(vector addition)이라고 불리는 \(V \times V\)로부터 \(V\)로의 함수와 스칼라 곱(scalar product)이라고 불리는 \(\mathbb{F} \times V\)로부터 \(V\)로의 함수가 주어져 있으며, 이 두 함수가 다음 조건을 모두 만족시킴을 뜻한다.

  1. 임의의 \(x,\,y,\,z\in V\)에 대하여 \(x + y = y + x\), \(x + (y + z) = (x + y) + z \)이다.
  2. \(V\)에 유일한 원소 \(0\)이 존재하여 모든 \(x \in V\)에 대해 \(x + 0 = x \)가 성립한다. (이때 \(0\)을 영벡터라고 부른다.)
  3. 각 \(x \in V\)에 대해 유일한 원소 \(-x \in V\)가 존재하여 \(x + (-x) = 0\)을 만족시킨다.
  4. 임의의 \(x\in V\)와 \(\alpha ,\, \beta \in \mathbb{F}\)에 대하여 \(1x = x\), \(\alpha(\beta x) = (\alpha\beta)x\)이다. (여기서 \(1\)은 \(\mathbb{F}\)에서 곱셈에 대한 항등원이다.)
  5. 임의의 \(x,\,y\in V\)와 \(\alpha ,\,\beta\in \mathbb{F}\)에 대하여 \(\alpha(x + y) = \alpha x + \alpha y\), \((\alpha + \beta)x = \alpha x + \beta x\)이다.

\(\mathbb{F} = \mathbb{R}\)인 경우 \(V\)를 실벡터공간(real vector space)이라고 부르고, \(\mathbb{F} = \mathbb{C}\)인 경우 \(V\)를 복소벡터공간(complex vector space)이라고 부른다. \(\mathbb{F}\)의 원소를 스칼라(scalar)라고 부르고, \(V\)의 원소를 벡터(vector)라고 부른다.

벡터공간을 선형공간(linear space)이라고 부르기도 한다.

별다른 언급 없이 “\(V\)가 벡터공간이다”라고 말하면 \(V\)는 적당한 체 \(\mathbb{F}\) 위에서 정의된 것으로 생각한다. 이때 \(\mathbb{F}\)를 \(\mathbb{R}\) 또는 \(\mathbb{C}\)라고 생각해도 무방하다.

책에 따라서는 벡터를 \(\mathbf{u},\) \(\mathbf{v},\) \(\mathbf{w},\) \(\cdots\)와 같은 글꼴로 나타내기도 한다. 그러나 우리는 벡터를 \(x,\) \(y,\) \(z,\) \(\cdots\)와 같이 평범한 이탤릭 문자로 나타내기로 하겠다.

부분공간

\(V\)가 벡터공간이고 \(U\)가 \(V\)의 부분집합이라고 하자. 이때 \(U\)가 \(V\)의 부분벡터공간(linear subspace)이라는 것은 \(U\)가 그 자체로 벡터공간인 것을 뜻한다. 단, 벡터 합과 스칼라 곱은 \(V\)에서와 동일한 것이 주어진 것으로 생각한다. (벡터 합은 정의역을 \(U\times U\)로 제한하고, 스칼라 곱은 정의역을 \(\mathbb{F}\times U\)로 제한한 것이다.) 부분벡터공간을 선형부분공간이라고 부르기도 하고, 간단하게 부분공간(subspace)이라고 부르기도 한다.

\(U\subseteq V\)이고 \(U\ne\varnothing\)일 때, \(U\)가 \(V\)의 부분공간이기 위한 필요충분조건은 다음과 같다.

“모든 \(\alpha,\,\beta \in \mathbb{F}\)와 모든 \(x,\,y \in U\)에 대하여, \(\alpha x + \beta y \in U\)이다.”

이를 부분공간 판정법이라고 부른다.

벡터의 일차결합과 벡터공간의 차원

\(V\)를 벡터공간이라 하고, \(\mathbf{v} = \{v_1, \ldots, v_k\} \subset V\)를 공집합이 아닌 유한집합이라 하자. 또한 \(A \subset V\)를 공집합이 아닌 임의의 집합이라 하자.

  1. \(\mathbf{v}\)의 원소들의 일차결합(linear combination)은 다음 형태의 벡터이다. \[\alpha_1 v_1 + \ldots + \alpha_k v_k \in V.\] 여기서 \(\alpha_1, \ldots, \alpha_k\)는 임의의 스칼라 집합이다. 일차결합을 선형결합이라고 부르기도 한다.
  2. \(\mathbf{v}\)가 일차독립(linearly independent)이라는 것은 다음이 성립하는 것을 뜻한다. \[\alpha_1 v_1 + \ldots + \alpha_k v_k = 0 \quad\Rightarrow\quad \alpha_1 = \ldots = \alpha_k = 0.\] 물론 여기서 \(\alpha_j \in \mathbb{F},\) \(v_j \in V\)이다.
  3. 집합 \(A\)가 일차독립이라는 것은 \(A\)의 모든 유한 부분집합이 일차독립인 것을 뜻한다. (단, 공집합은 일차독립인 것으로 약속한다.) \(A\)가 일차독립이 아닐 때, “\(A\)는 일차종속이다”라고 말한다. 일차독립과 일차종속을 각각 선형독립, 선형종속이라고 표현하기도 한다.
  4. \(A\)의 모든 유한 부분집합의 모든 일차결합의 집합을 \(A\)의 생성(span) 또는 \(A\)에 의하여 생성된 집합(spanned set)이라고 부르고, \(\operatorname{Sp} A\) 또는 \(\operatorname{Span} A\)로 나타낸다. (단, 공집합의 생성집합은 \(\left\{ 0 \right\}\)인 것으로 약속한다.) \(\operatorname{Sp} A\)는 \(A\)를 포함하는 \(V\)의 모든 부분공간의 교집합과 일치한다. 즉 \(\operatorname{Sp} A\)는 \(A\)를 포함하는 \(V\)의 부분공간 중 가장 작은 것이다.
  5. \(\mathbf{v}\)가 일차독립이고 \(\operatorname{Sp} \mathbf{v} = V\)일 때, \(\mathbf{v}\)를 \(V\)의 기저(basis)라고 부른다. (단, 영벡터공간 \(\left\{ 0 \right\}\)의 기저는 공집합으로 정의한다.) 벡터공간 \(V\)가 기저를 가진다면, \(V\)의 모든 기저는 같은 개수의 원소를 가진다. 이 개수가 \(k\)라면 “\(V\)의 차원(dimension)을 \(k\)로 정의한다. (영공간의 차원은 \(0\)이다.) 이것을 기호로 \(\dim V = k\)와 같이 나타낸다. 유한집합인 기저를 갖는 벡터공간을 유한차원 벡터공간이라고 부르고, 무한집합인 기저를 갖는 벡터공간을 무한차원 벡터공간이라고 부른다.
  6. \(\mathbf{v}\)가 \(V\)의 기저일 때, 임의의 벡터 \(x \in V\)에 대하여 유일한 스칼라들 \(\alpha_j\), \(j = 1, \ldots, k\)가 존재하여, \(x\)를 \[x = \alpha_1 v_1 + \ldots + \alpha_k v_k\] 와 같이 일차결합 형태로 나타낼 수 있다. 이 스칼라들을 기저 \(\mathbf{v}\)에 대한 \(x\)의 성분이라고 부른다. 벡터 \(x\)를 기저 \(\mathbf{v}\)를 기준으로 좌표로 표현할 수 있다. 즉 \(k\times 1\) 행렬 \[[x]_\mathbf{v} = \begin{pmatrix} \alpha_1 \\ \alpha_2 \\ \vdots \\ \alpha_k \end{pmatrix} \] 로 표현하거나, \(k\)-순서쌍 \[( \alpha_1 ,\, \alpha_2 ,\, \ldots ,\, \alpha_k )\] 로 표현할 수 있다.
  7. 집합 \(\mathbb{F}^k\)는 \(\mathbb{F}\) 위의 벡터공간이고, 벡터 \[\begin{aligned} \hat{e}_1 &= (1,\,0,\,0,\,\ldots,\,0),\\[6pt] \hat{e}_2 &= (0,\,1,\,0,\,\ldots,\,0),\\[6pt] &\,\vdots\\[6pt] \hat{e}_k &= (0,\,0,\,0,\,\ldots,\,1) \end{aligned} \] 로 이루어진 집합은 \(\mathbb{F}^k\)의 기저이다. 이 기저를 \(\mathbb{F}^k\)의 표준기저(standard basis)라고 부른다. 벡터 \(x\)를 표준기저 \(\mathbf{b}\)를 기준으로 좌표로 표현할 때는 \([x]_\mathbf{b}\)를 간단하게 \([x]\)로 표현한다.
직적

\(V,\) \(W\)를 \(\mathbb{F}\) 위의 벡터공간이라 하자. 이때 데카르트곱 \(V\times W\)에 벡터 합과 스칼라 곱을 적절히 정의하여 \(V\times W\)가 벡터공간이 되도록 할 수 있다. 즉 임의의 \(\alpha \in \mathbb{F}\)와 임의의 \((x_j, \, y_j) \in V \times W\), \(j = 1, \,2\)에 대하여 \[\begin{aligned} (x_1,\,y_1) + (x_2,\,y_2) &= (x_1 + x_2,\,y_1 + y_2), \\[6pt] \alpha(x_1,\,y_1) &= (\alpha x_1,\,\alpha y_1) \end{aligned}\] 라고 정의된 연산이 있을 때, 벡터공간 \(V\times W\)를 직적(direct product)이라고 부른다. 각 등식에서 우변의 순서쌍 안의 연산은 \(V\)와 \(W\)에 주어져 있는 벡터 합과 스칼라 곱 연산이다.

함수공간

\(S\)를 집합이라 하고 \(V\)를 \(\mathbb{F}\) 위의 벡터공간이라 하자. \(S\)에서 \(V\)로의 함수들의 집합을 \(F(S,\,V)\)로 나타낸다. 임의의 \(\alpha \in \mathbb{F}\)와 임의의 \(f,\,g \in F(S,\,V)\)에 대해, \(F(S,\,V)\)에서의 함수 \(f + g\)와 \(\alpha f\)를 다음과 같이 정의한다. \[\begin{aligned} \forall x \in V : \, (f + g)(x) &= f(x) + g(x),\\[6pt] \forall x \in V : \, (\alpha f)(x) &= \alpha f(x). \end{aligned}\] 이와 같이 정외된 벡터 합과 스칼라 곱이 주어진 집합 \(F(S,\,V)\)는 \(\mathbb{F}\) 위의 벡터공간이 된다.

만약 \(S\)가 정수 집합 \(\{1,\,\ldots,\,k\}\)라면 집합 \(F(S,\,\mathbb{F})\)는 공간 \(\mathbb{F}^k\)와 동일시될 수 있다. 즉 각 원소 \(x \in \mathbb{F}^k\)를 \[f(j) = x_j ,\,\, 1\le j\le k\] 라고 정의된 함수 \(f \in F(S,\,\mathbb{F})\)에 대응시킴으로써, 두 공간은 동일한 구조를 가짐을 알 수 있다.

선형변환

선형변환의 개념

\(V,\) \(W\)를 동일한 체 \(\mathbb{F}\) 위의 벡터공간이라 하자. 함수 \(T : V \to W\)가 선형변환(linear transformation)이라는 것은, 임의의 \(\alpha,\,\beta \in \mathbb{F}\)와 \(x,\,y \in V\)에 대해, \[T(\alpha x + \beta y) = \alpha T(x) + \beta T(y)\] 가 성립하는 것을 뜻한다. 선형변환을 선형사상이라고 부르기도 한다.

\(V\)에서 \(W\)로의 모든 선형변환의 집합을 \(L(V,\,W)\)로 표기한다. 공역이 벡터공간인 함수를 모은 함수공간은 벡터공간이므로 \(L(V,\,W)\)는 벡터공간이다. 또한 이 공간은 \(F(V,\,W)\)의 부분공간이다. \(V = W\)인 경우 \(L(V,\,V)\)를 \(L(V)\)로 줄여 쓴다.

\(L(V)\)에서 특히 간단한 선형변환은 \[I_V (x) = x,\,\, x \in V\]로 정의된다. 이를 \(V\) 위의 항등변환이라고 부른다. 항등변환의 정의역이 명확하여 혼동할 염려가 없으면, \(I_V\)를 간단히 \(I\)로 나타낸다.

선형변환의 합성

\(V,\) \(W,\) \(X\)가 벡터공간이고 \(T \in L(V,\,W)\), \(S \in L(W,\,X)\)라고 하자. 그러면 합성함수 \(S\circ T\)는 선형변환이다. 즉 \(S \circ T \in L(V,\,X)\)이다.

선형변환의 합성은 대수적으로 유용한 성질을 가진다. \(V\)가 벡터공간이라 하고 \(R,\,S,\,T \in L(V)\)이며 \(\alpha \in \mathbb{F}\)라 하자. 그러면 다음이 성립한다.

  1. \(R \circ (S \circ T) = (R \circ S) \circ T.\)
  2. \(R \circ (S + T) = R \circ S + R \circ T.\)
  3. \((S + T) \circ R = S \circ R + T \circ R.\)
  4. \(I_V \circ T = T \circ I_V = T.\)
  5. \((\alpha S) \circ T = \alpha (S \circ T) = S \circ (\alpha T).\)

이러한 성질들은 합성 연산이 정의되는 경우 서로 다른 공간 사이의 선형변환에 대해서도 성립한다.

선형변환의 기본성질

\(V,\) \(W\)가 벡터공간이라 하고 \(T \in L(V,\,W)\)라 하자. 이때 다음이 성립한다.

  1. \(T(0) = 0\).
  2. \(U\)가 \(V\)의 부분공간이면 집합 \(T(U)\)는 \(W\)의 부분공간이고 \(\dim T(U) \leq \dim U\)이다.
  3. \(U\)가 \(W\)의 부분공간이면 집합 \(\{x \in V \,\vert\, T(x) \in U\}\)는 \(V\)의 부분공간이다.
선형변환과 관련된 부분공간

\(V,\) \(W\)가 벡터공간이라 하고 \(T \in L(V,\,W)\)라 하자.

  1. \(T\)의 (image)은 부분공간 \(\operatorname{Im} T = T(V)\)이다. (\(T\)의 상을 \(T\)의 치역(range)이라고 부르기도 한다.) \(T\)의 계수(rank)는 수 \(r(T) = \dim(\operatorname{Im} T)\)이다. (계수를 랭크 또는 차수라고 부르기도 한다. 또한 \(r(T)\)를 \(\operatorname{rank}(T)\)와 같이 나타내기도 한다.
  2. \(T\)의 (kernel)은 부분공간 \(\operatorname{Ker} T = \{x \in V : T(x) = 0\}\)이다. (\(T\)의 핵을 \(T\)의 영공간(null space) 또는 커널이라고 부르기도 한다.) \(T\)의 영차수(nullity)는 수 \(n(T) = \dim(\operatorname{Ker} T)\)이다. (영차수를 퇴화차수 또는 널리티라고 부르기도 한다. 또한 \(n(T)\)를 \(\operatorname{nullity}(T)\)로 나타내기도 한다.)
  3. 계수와 영차수 \(\operatorname{rank}(T),\) \(\operatorname{nullity}(T)\)는 각각 무한대일 수 있다.
  4. \(T\)가 유한 계수를 가진다는 것은 \(\operatorname{rank}(T)\)가 유한한 것이다.
  5. \(T\)가 일대일 선형변환(one-to-one linear transformation)이라는 것은, 임의의 \(y \in W\)에 대해, 방정식 \(T(x) = y\)가 많아야 하나의 해 \(x\)를 가지는 것이다. 일대일 선형변환을 단사(injective) 선형변환이라고 부르기도 한다.
  6. \(T\)가 \(W\) 위로의 선형변환(linear transformation onto \(W\))이라는 것은, 임의의 \(y \in W\)에 대해, 방정식 \(T(x) = y\)가 적어도 하나의 해 \(x\)를 가지는 것이다. 공역 위로의 선형변환을 전사(surjective) 선형변환이라고 부르기도 한다.
  7. \(T\)가 일대일대응(one-to-one correspondence)이라는 것은, 임의의 \(y \in W\)에 대해, 방정식 \(T(x) = y\)가 정확히 하나의 해 \(x\)를 가지는 것이다. 즉 \(T\)가 일대일대응이라는 것은 일대일이면서 위로의 선형변환임을 뜻한다. 일대일대응을 전단사(bijective)라고 부르기도 한다.
선형변환의 영차수 및 계수와 관련된 성질

선형변환의 영차수 및 계수와 관련하여 다음이 성립한다. \(V,\) \(W\)가 벡터공간이라 하고 \(T \in L(V,\,W)\)라 하자.

  1. \(T\)가 일대일일 필요충분조건은 방정식 \(T(x) = 0\)이 자명한 해 \(x = 0\)만을 가지는 것이다. 이는 \(\operatorname{Ker} T = \{0\}\) 또는 \(\operatorname{nullity}(T) = 0\)과 동치이다.
  2. \(T\)가 위로의 선형변환일 필요충분조건은 \(\operatorname{Im} T = W\)인 것이다. \(\dim W\)가 유한이면, 이는 \(\operatorname{rank}(T) = \dim W\)와 동치이다.
  3. \(T \in L(V,\,W)\)가 일대일대응일 필요충분조건은 유일한 변환 \(S \in L(W,\,V)\)가 존재하여 이 변환이 일대일대응이고 \(S \circ T = I_V\)이며 \(T \circ S = I_W\)인 것이다.
  4. 만약 \(V\)가 \(k\)차원이면 \[\operatorname{rank}(T) + \operatorname{nullity}(T) = k\] 가 성립한다. 이를 ‘차원 정리’ 또는 ‘Rank-Nullity 정리’라고 부른다. 이 정리에서 \(\operatorname{rank}(T)\)는 \(W\)의 차원이 유한인지 여부와 상관없이 반드시 유한하다. 만약 \(W\) 또한 \(k\)차원이면, \(T\)가 일대일대응일 필요충분조건은 \(\operatorname{nullity}(T) = 0\)인 것이다.
선형변환의 행렬표현

\(U\)와 \(V\)가 동일한 체 위에서 정의된 유한차원 벡터공간이고, 이들의 차원이 양의 정수 \(n,\) \(m\)이라고 하자. 그리고 \(U,\) \(V\)에 각각 기저 \[\begin{aligned} \mathbf{u} &= \left\{ u_1 ,\, u_2 ,\, \ldots ,\, u_n \right\}, \\[6pt] \mathbf{v} &= \left\{ v_1 ,\, v_2 ,\, \ldots ,\, v_m \right\} \end{aligned}\] 이 주어졌다고 하자. 또한 \(T:U \rightarrow V\)를 선형변환이라고 하자. 이때 각 \(u_j ,\) \(j=1,\,2,\,\ldots ,\, n\)에 대하여 \(T(u_j )\)를 기저 \(\mathbf{v}\)를 기준으로 나타냈을 때 \(i\)째 성분 \(a_{ij}\)를 성분으로 갖는 \(m\times n\) 행렬을 \(\mathbf{u}\)와 \(\mathbf{v}\)에 대한 \(T\)의 행렬표현(matrix representation)이라고 부르고 \(M_{\mathbf{u}}^{\mathbf{v}} (T )\) 또는 \([ T ] _{\mathbf{u}}^{\mathbf{v}} \)와 같이 나타낸다. \(x\in U\)와 \(y\in V\)에 대하여 \(y=T(x)\)일 때 \[[y]_{\mathbf{v}} = [ T ] _{\mathbf{u}}^{\mathbf{v}} \, [x]_{\mathbf{u}} \] 즉 \[[T(x)]_{\mathbf{v}} = [ T ] _{\mathbf{u}}^{\mathbf{v}} \, [x]_{\mathbf{u}} \] 가 성립한다. 여기서 우변은 행렬곱이다.

선형변환의 행렬표현은 다음과 같은 성질을 가진다.

  1. 대응 \(T \mapsto M_{\mathbf{u}}^{\mathbf{v}}(T)\)는 \(L(U,\,V)\)에서 \(M_{mn}(\mathbb{F})\)로의 일대일대응인 선형변환이다. 즉, \(S,\,T \in L(U,\,V)\)이고 \(\alpha \in \mathbb{F}\)이면, \[\begin{aligned} M_{\mathbf{u}}^{\mathbf{v}}(\alpha T) &= \alpha M_{\mathbf{u}}^{\mathbf{v}}(T),\\[6pt] M_{\mathbf{u}}^{\mathbf{v}}(S + T) &= M_{\mathbf{u}}^{\mathbf{v}}(S) + M_{\mathbf{u}}^{\mathbf{v}}(T) \end{aligned}\] 가 성립한다.
  2. \(W\)가 \(l\)차원 벡터공간이며, 기저 \(\mathbf{w}\)를 가진다고 하자. 또한 \(T \in L(U,\,V),\) \(S \in L(V,\,W)\)라고 하자. 이때 \[M_{\mathbf{u}}^{\mathbf{w}}(ST) = M_{\mathbf{v}}^{\mathbf{w}}(S)M_{\mathbf{u}}^{\mathbf{v}}(T)\] 가 성립한다.

유한차원 벡터공간 사이에서 정의된 선형변환을 행렬로 나타낼 수 있는 것처럼, 행렬을 곱하는 연산을 통해 선형변환을 정의할 수 있다. 이 두 가지 변환은 서로 완전히 역대응 관계이다. 즉 \(\mathbf{u}\)를 \(\mathbb{F}^n\)의 표준기저라 하고 \(\mathbf{v}\)를 \(\mathbb{F}^m\)의 표준기저라 하자. 또한 \(C \in M_{mn}(\mathbb{F})\)이고 \(T \in L(\mathbb{F}^n,\,\mathbb{F}^m)\)이라 하자. 그러면 다음이 성립한다.

  1. \(M_{\mathbf{u}}^{\mathbf{v}}(T_C) = C .\)
  2. \(T_B = T.\) (여기서 \(B = M_{\mathbf{u}}^{\mathbf{v}}(T)\)이다.)
좌표변환행렬

벡터공간 \(V\)의 차원이 양의 정수 \(k\)이고 \(I\in L(V)\)가 항등변환이며, \(\mathbf{u}\)와 \(\mathbf{v}\)가 각각 \(V\)의 기저라고 하자. 그러면 임의의 벡터 \(x\in V\)에 대하여 \[ [x]_{\mathbf{v}} = [I]_{\mathbf{u}}^{\mathbf{v}} [x]_{\mathbf{u}} \] 가 성립한다. 즉 항등변환의 행렬표현 \([I]_{\mathbf{u}}^{\mathbf{v}}\)는 기저 \(\mathbf{u}\)에 대한 벡터 \(x\)의 좌표를 기저 \(\mathbf{v}\)에 대한 벡터 \(x\)의 좌표로 변환해주는 행렬이 된다. 이때 \([I]_{\mathbf{u}}^{\mathbf{v}}\)를 좌표변환행렬(transition matrix)이라고 부르고 \(P_{\mathbf{u} \rightarrow \mathbf{v}}\)와 같이 나타낸다.

두 벡터공간 \(U\)와 \(V\)의 차원이 각각 양의 정수 \(n,\) \(m\)이고, \(\mathbf{u}_1\)과 \(\mathbf{u}_2\)가 \(U\)의 기저이며, \(\mathbf{v}_1\)과 \(\mathbf{v}_2\)가 \(V\)의 기저라고 하자. 또한 \(T\in L(U,\,V)\)라고 하자. 이때 다음이 성립한다. \[ [T]_{\mathbf{u}_2}^{\mathbf{v}_2} = P_{\mathbf{v}_1 \rightarrow \mathbf{v}_2} \, [T]_{\mathbf{u}_1}^{\mathbf{v}_1} \, P_{\mathbf{u}_2 \rightarrow \mathbf{u}_1} . \]

닮은행렬

\(A\)와 \(B\)가 \(k\times k\) 정사각행렬이라고 하자. 만약 \(k\times k\) 가역행렬 \(P\)가 존재하여 \[B = P^{-1} A P\] 를 만족시키면, \(A\)와 \(B\)를 닮은행렬(similar matrix)이라고 부른다.

벡터공간 \(V\)가 \(k\)차원이고 \(V\)에 기저 \(\mathbf{v}_1\)과 \(\mathbf{v}_2\)가 주어졌으며 \(T\in L(V)\)라고 하자. 또한 \[\begin{aligned} A &= [T]_{\mathbf{v}_1}^{\mathbf{v}_1} ,\\[6pt] B &= [T]_{\mathbf{v}_2}^{\mathbf{v}_2} ,\\[6pt] P &= P_{\mathbf{v}_2 \rightarrow \mathbf{v}_1 } \end{aligned}\] 이라고 하자. 그러면 \[ [T]_{\mathbf{v}_2}^{\mathbf{v}_2} = ( P_{\mathbf{v}_2 \rightarrow \mathbf{v}_1} )^{-1} \, [T]_{\mathbf{v}_1}^{\mathbf{v}_1} \, P_{\mathbf{v}_2 \rightarrow \mathbf{v}_1} \] 즉 \[B = P^{-1} A P\] 가 성립한다. 이러한 관점으로 보았을 때, 두 정사각행렬 \(A\)와 \(B\)가 닮은행렬이라 함은 \(A\)와 \(B\)가 한 선형변환의 다른 행렬표현임을 뜻한다.

고윳값과 고유벡터

고윳값과 고유벡터

\(V\)를 벡터공간이라 하고 \(T \in L(V)\)라 하자. 스칼라 \(\lambda \in \mathbb{F}\)가 \(T\)의 고윳값(eigenvalue)이라는 것은 방정식 \(T(x) = \lambda x\)가 자명하지 않은 해(\(0\)이 아닌 해) \(x \in V\)를 가지는 것이다. 이때 그러한 비자명해를 \(\lambda\)에 대응되는 \(T\)의 고유벡터(eigenvector)라고 부른다. 부분공간 \(\operatorname{Ker}(T - \lambda I) \subset V\)를 \(\lambda\)에 대응하는 고유공간(eigenspace)이라 부른다. 이때 \(\lambda\)의 중복도(multiplicity)를 수 \(m_\lambda = \operatorname{nullity}(T - \lambda I)\)로 정의한다.

특성다항식

\(V\)의 차원이 양의 정수이고 \(\mathbf{b}\)가 \(V\)의 기저이며 \(T\in L(V)\)이고 \(A = [T]_{\mathbf{v}}\)라고 하자. 이때 \[p_T (\lambda) = \det(tI-A)\] 는 \(t\)에 대한 \(k\)차 다항식이 된다. 이 다항식을 \(T\)의 특성다항식(characteristic polynomial) 또는 \(A\)의 특성다항식이라고 부른다. 또한 방정식 \(p(t) = 0\)을 \(T\)의 특성방정식(characteristic equation) 또는 \(A\)의 특성방정식이라고 부른다. \(V\)의 기저 \(\mathbf{b}\)에 따라 \(T\)의 행렬표현 \(A\)는 달라질 수 있지만 \(T\)의 특성다항식 \(p_T (t)\)는 달라지지 않는다.

선형변환 \(T\)의 특성다항식이 \(p_T (t)\)일 때, \(\lambda\)가 \(T\)의 고윳값이 되기 위한 필요충분조건은 \(\lambda\)가 특성방정식 \(p_T (t)=0\)의 해인 것이다.

해의 범위가 \(\mathbb{R}\)인지 \(\mathbb{C}\)인지 여부에 따라 방정식의 해가 달라질 수 있다. 즉 특성방정식의 해는 \(\mathbb{F} = \mathbb{R}\)인 경우와 \(\mathbb{F} = \mathbb{C}\)인 경우 달라질 수 있다. 그러므로 체를 어느 것으로 정하느냐에 따라 \(T\)의 고윳값이 달라질 수 있다.

\(\lambda\)가 \(T\)의 고윳값이고, \(T\)의 특성다항식 \(p_T (t)\)가 인수 \((t-\lambda)^m\)을 갖지만 \((t-\lambda)^{m+1}\)은 인수로 갖지 않을 때, \(m\)을 고윳값 \(\lambda\)의 대수적 중복도(algebraic multiplicity)라고 부른다.

집합 \(E_\lambda = \left\{ x\in V \,\vert\, T(x) = \lambda x \right\}\) 는 \(V\)의 부분공간이 되는데, 이 공간 \(E_\lambda\)를 고윳값 \(\lambda\)에 대응되는 고유공간(eigenspace)이라고 부른다. 이때 \(E_\lambda\)의 차원을 고윳값 \(\lambda\)의 기하적 중복도(geometric multiplicity) 또는 간단하게 중복도라고 부른다.

고윳값과 고유벡터의 성질

\(V\)를 \(n\)차원 벡터공간이라 하고 \(T \in L(V)\)라 하자. \(\{\lambda_1,\,\ldots,\,\lambda_k\}\)를 \(T\)의 서로 다른 고윳값들의 집합이라 하고, 각 \(j=1,\,2,\,\ldots,\,k\)에 대해 \(x_j\)를 \(\lambda_j\)에 대응하는 고유벡터라 하자. 그러면 집합 \(\{x_1,\,\ldots,\,x_k\}\)는 일차독립이다.

각 고윳값 \(\lambda_j\)에 대응되는 일차독립인 \(m_j\)개의 고유벡터 \[x_{j,1} ,\, x_{j,2} ,\, \ldots ,\, x_{j,m_j}\] 가 존재한다. 이때 이 벡터는 \(\lambda_j\)의 고유공간 \(E_{\lambda_j}\)의 기저가 된다. 만약 서로 다른 고윳값 \(\lambda_j\)에 대하여 \[m_1 + m_2 + \ldots + m_k = n\] 이면 각 고윳값에 대응되는 고유벡터를 모두 모은 다음과 같은 벡터들은 \(V\)의 기저를 이룬다. \[\begin{gathered} x_{1,1} ,\, x_{1,2} ,\, \ldots ,\, x_{1,m_1} ,\\[6pt] x_{2,1} ,\, x_{2,2} ,\, \ldots ,\, x_{2,m_2} ,\\[6pt] \vdots \\[6pt] x_{k,1} ,\, x_{k,2} ,\, \ldots ,\, x_{k,m_k} . \end{gathered}\] 즉 \[V = E_{\lambda_1} \oplus E_{\lambda_2} \oplus \cdots \oplus E_{\lambda_k}\] 가 성립한다. 이와 같은 기저를 \(T\)에 대한 \(V\)의 고유기저(eigenbasis)라고 부른다.

대각화

\(V\)가 \(n\)차원 벡터공간이고 \(T\in L(V)\)이며 \(T\)의 각 고윳값의 대수적 중복도와 기하적 중복도가 일치한다고 하자. 그리고 \(T\)에 대한 \(V\)의 고유기저가 다음과 같다고 하자. \[\mathbf{b} = \left\{ x_1 ,\, x_2 ,\, \cdots ,\, x_n \right\}.\] 이때 기저 \(\mathbf{b}\)에 대한 \(T\)의 행렬표현 \([ T ] _{\mathbf{b}}\)는 고윳값을 대각성분으로 갖는 \(n\times n\) 대각행렬이 된다. 이처럼 \([ T ] _{\mathbf{b}}\)가 대각행렬이 되도록 하는 \(V\)의 기저 \(\mathbf{b}\)가 존재할 때, “\(T\)는 대각화 가능하다(diagonalizable)”라고 말한다.

\(A\)가 \(n\times n\) 행렬이라고 하자. 그러면 벡터공간 \(\mathbb{F} ^n\)의 표준기저 \(\mathbf{e}\)에 대하여 \[T(x) = A \,[x]_{\mathbf{e}}\] 라고 정의함으로써 \(T\)는 정의역과 공역이 \(\mathbb{F} ^n\)인 선형변환이다. 만약 \(T\)가 대각화 가능하고 \(\mathbf{b}\)가 \([T]_{\mathbf{b}}\)가 대각행렬이 되도록 하는 고유기저라면 \[ A = [T]_{\mathbf{e}} = (P_{\mathbf{e} \rightarrow \mathbf{b}})^{-1} \, [T]_{\mathbf{b}} \, P_{\mathbf{e} \rightarrow \mathbf{b}}\] 가 성립한다. 여기서 \(D = [T]_{\mathbf{b}} ,\) \(P = P_{\mathbf{e} \rightarrow \mathbf{b}}\)라고 하면 \(D\)는 대각행렬이고 \[A = P^{-1} D P\] 가 성립한다. 위 식의 우변을 행렬 \(A\)의 대각화(diagonalization)라고 부른다. 또한 행렬 \(A = [T]_\mathbf{e}\)가 대각화 가능하다는 것은 선형변환 \(T\)가 대각화 가능하다는 것과 같은 의미로 정의한다.

\(\mathbb{F} = \mathbb{R}\)일 때 행렬 \(A\)가 대각화 가능하면 “\(A\)는 실대각화 가능하다”라고 말하며, \(\mathbb{F} = \mathbb{C}\)일 때 행렬 \(A\)가 대각화 가능하면 “\(A\)는 복소대각화 가능하다”라고 말한다.

내적(inner product)의 개념을 도입하고 벡터의 직교성(orthogonality)을 정의한 뒤 선형변환과 행렬의 직교대각화 가능성을 논할 수 있다. 그리고 대각화 불가능한 행렬의 경우 조르단 표준형(Jordan canonical form)을 사용하여 대각화에 가까운 형태로 변형할 수 있다. 또한 정사각행렬이 아닌 행렬의 경우 특잇값 분해(singular value decomposition)를 시도할 수 있다.