이 포스트에서는 수학의 다양한 분야를 공부하기 위해 필요한 선형대수학 내용을 간략하게 살펴봅니다.
벡터공간
선형변환
고윳값과 고유벡터
벡터공간
벡터공간의 뜻
\(\mathbb{F}\)가 체(field)이고, \(V\)가 공집합이 아닌 집합라고 하자. \(V\)가 \(\mathbb{F}\) 위에서의 벡터공간(vector space)이라 함은, 벡터 합(vector addition)이라고 불리는 \(V \times V\)로부터 \(V\)로의 함수와 스칼라 곱(scalar product)이라고 불리는 \(\mathbb{F} \times V\)로부터 \(V\)로의 함수가 주어져 있으며, 이 두 함수가 다음 조건을 모두 만족시킴을 뜻한다.
- 임의의 \(x,\,y,\,z\in V\)에 대하여 \(x + y = y + x\), \(x + (y + z) = (x + y) + z \)이다.
- \(V\)에 유일한 원소 \(0\)이 존재하여 모든 \(x \in V\)에 대해 \(x + 0 = x \)가 성립한다. (이때 \(0\)을 영벡터라고 부른다.)
- 각 \(x \in V\)에 대해 유일한 원소 \(-x \in V\)가 존재하여 \(x + (-x) = 0\)을 만족시킨다.
- 임의의 \(x\in V\)와 \(\alpha ,\, \beta \in \mathbb{F}\)에 대하여 \(1x = x\), \(\alpha(\beta x) = (\alpha\beta)x\)이다. (여기서 \(1\)은 \(\mathbb{F}\)에서 곱셈에 대한 항등원이다.)
- 임의의 \(x,\,y\in V\)와 \(\alpha ,\,\beta\in \mathbb{F}\)에 대하여 \(\alpha(x + y) = \alpha x + \alpha y\), \((\alpha + \beta)x = \alpha x + \beta x\)이다.
\(\mathbb{F} = \mathbb{R}\)인 경우 \(V\)를 실벡터공간(real vector space)이라고 부르고, \(\mathbb{F} = \mathbb{C}\)인 경우 \(V\)를 복소벡터공간(complex vector space)이라고 부른다. \(\mathbb{F}\)의 원소를 스칼라(scalar)라고 부르고, \(V\)의 원소를 벡터(vector)라고 부른다.
벡터공간을 선형공간(linear space)이라고 부르기도 한다.
별다른 언급 없이 “\(V\)가 벡터공간이다”라고 말하면 \(V\)는 적당한 체 \(\mathbb{F}\) 위에서 정의된 것으로 생각한다. 이때 \(\mathbb{F}\)를 \(\mathbb{R}\) 또는 \(\mathbb{C}\)라고 생각해도 무방하다.
책에 따라서는 벡터를 \(\mathbf{u},\) \(\mathbf{v},\) \(\mathbf{w},\) \(\cdots\)와 같은 글꼴로 나타내기도 한다. 그러나 우리는 벡터를 \(x,\) \(y,\) \(z,\) \(\cdots\)와 같이 평범한 이탤릭 문자로 나타내기로 하겠다.
부분공간
\(V\)가 벡터공간이고 \(U\)가 \(V\)의 부분집합이라고 하자. 이때 \(U\)가 \(V\)의 부분벡터공간(linear subspace)이라는 것은 \(U\)가 그 자체로 벡터공간인 것을 뜻한다. 단, 벡터 합과 스칼라 곱은 \(V\)에서와 동일한 것이 주어진 것으로 생각한다. (벡터 합은 정의역을 \(U\times U\)로 제한하고, 스칼라 곱은 정의역을 \(\mathbb{F}\times U\)로 제한한 것이다.) 부분벡터공간을 선형부분공간이라고 부르기도 하고, 간단하게 부분공간(subspace)이라고 부르기도 한다.
\(U\subseteq V\)이고 \(U\ne\varnothing\)일 때, \(U\)가 \(V\)의 부분공간이기 위한 필요충분조건은 다음과 같다.
“모든 \(\alpha,\,\beta \in \mathbb{F}\)와 모든 \(x,\,y \in U\)에 대하여, \(\alpha x + \beta y \in U\)이다.”
벡터의 일차결합과 벡터공간의 차원
\(V\)를 벡터공간이라 하고, \(\mathbf{v} = \{v_1, \ldots, v_k\} \subset V\)를 공집합이 아닌 유한집합이라 하자. 또한 \(A \subset V\)를 공집합이 아닌 임의의 집합이라 하자.
- \(\mathbf{v}\)의 원소들의 일차결합(linear combination)은 다음 형태의 벡터이다. \[\alpha_1 v_1 + \ldots + \alpha_k v_k \in V.\] 여기서 \(\alpha_1, \ldots, \alpha_k\)는 임의의 스칼라 집합이다. 일차결합을 선형결합이라고 부르기도 한다.
- \(\mathbf{v}\)가 일차독립(linearly independent)이라는 것은 다음이 성립하는 것을 뜻한다. \[\alpha_1 v_1 + \ldots + \alpha_k v_k = 0 \quad\Rightarrow\quad \alpha_1 = \ldots = \alpha_k = 0.\] 물론 여기서 \(\alpha_j \in \mathbb{F},\) \(v_j \in V\)이다.
- 집합 \(A\)가 일차독립이라는 것은 \(A\)의 모든 유한 부분집합이 일차독립인 것을 뜻한다. (단, 공집합은 일차독립인 것으로 약속한다.) \(A\)가 일차독립이 아닐 때, “\(A\)는 일차종속이다”라고 말한다. 일차독립과 일차종속을 각각 선형독립, 선형종속이라고 표현하기도 한다.
- \(A\)의 모든 유한 부분집합의 모든 일차결합의 집합을 \(A\)의 생성(span) 또는 \(A\)에 의하여 생성된 집합(spanned set)이라고 부르고, \(\operatorname{Sp} A\) 또는 \(\operatorname{Span} A\)로 나타낸다. (단, 공집합의 생성집합은 \(\left\{ 0 \right\}\)인 것으로 약속한다.) \(\operatorname{Sp} A\)는 \(A\)를 포함하는 \(V\)의 모든 부분공간의 교집합과 일치한다. 즉 \(\operatorname{Sp} A\)는 \(A\)를 포함하는 \(V\)의 부분공간 중 가장 작은 것이다.
- \(\mathbf{v}\)가 일차독립이고 \(\operatorname{Sp} \mathbf{v} = V\)일 때, \(\mathbf{v}\)를 \(V\)의 기저(basis)라고 부른다. (단, 영벡터공간 \(\left\{ 0 \right\}\)의 기저는 공집합으로 정의한다.) 벡터공간 \(V\)가 기저를 가진다면, \(V\)의 모든 기저는 같은 개수의 원소를 가진다. 이 개수가 \(k\)라면 “\(V\)의 차원(dimension)을 \(k\)로 정의한다. (영공간의 차원은 \(0\)이다.) 이것을 기호로 \(\dim V = k\)와 같이 나타낸다. 유한집합인 기저를 갖는 벡터공간을 유한차원 벡터공간이라고 부르고, 무한집합인 기저를 갖는 벡터공간을 무한차원 벡터공간이라고 부른다.
- \(\mathbf{v}\)가 \(V\)의 기저일 때, 임의의 벡터 \(x \in V\)에 대하여 유일한 스칼라들 \(\alpha_j\), \(j = 1, \ldots, k\)가 존재하여, \(x\)를 \[x = \alpha_1 v_1 + \ldots + \alpha_k v_k\] 와 같이 일차결합 형태로 나타낼 수 있다. 이 스칼라들을 기저 \(\mathbf{v}\)에 대한 \(x\)의 성분이라고 부른다. 벡터 \(x\)를 기저 \(\mathbf{v}\)를 기준으로 좌표로 표현할 수 있다. 즉 \(k\times 1\) 행렬 \[[x]_\mathbf{v} = \begin{pmatrix} \alpha_1 \\ \alpha_2 \\ \vdots \\ \alpha_k \end{pmatrix} \] 로 표현하거나, \(k\)-순서쌍 \[( \alpha_1 ,\, \alpha_2 ,\, \ldots ,\, \alpha_k )\] 로 표현할 수 있다.
- 집합 \(\mathbb{F}^k\)는 \(\mathbb{F}\) 위의 벡터공간이고, 벡터 \[\begin{aligned} \hat{e}_1 &= (1,\,0,\,0,\,\ldots,\,0),\\[6pt] \hat{e}_2 &= (0,\,1,\,0,\,\ldots,\,0),\\[6pt] &\,\vdots\\[6pt] \hat{e}_k &= (0,\,0,\,0,\,\ldots,\,1) \end{aligned} \] 로 이루어진 집합은 \(\mathbb{F}^k\)의 기저이다. 이 기저를 \(\mathbb{F}^k\)의 표준기저(standard basis)라고 부른다. 벡터 \(x\)를 표준기저 \(\mathbf{b}\)를 기준으로 좌표로 표현할 때는 \([x]_\mathbf{b}\)를 간단하게 \([x]\)로 표현한다.
직적
\(V,\) \(W\)를 \(\mathbb{F}\) 위의 벡터공간이라 하자. 이때 데카르트곱 \(V\times W\)에 벡터 합과 스칼라 곱을 적절히 정의하여 \(V\times W\)가 벡터공간이 되도록 할 수 있다. 즉 임의의 \(\alpha \in \mathbb{F}\)와 임의의 \((x_j, \, y_j) \in V \times W\), \(j = 1, \,2\)에 대하여 \[\begin{aligned} (x_1,\,y_1) + (x_2,\,y_2) &= (x_1 + x_2,\,y_1 + y_2), \\[6pt] \alpha(x_1,\,y_1) &= (\alpha x_1,\,\alpha y_1) \end{aligned}\] 라고 정의된 연산이 있을 때, 벡터공간 \(V\times W\)를 직적(direct product)이라고 부른다. 각 등식에서 우변의 순서쌍 안의 연산은 \(V\)와 \(W\)에 주어져 있는 벡터 합과 스칼라 곱 연산이다.
함수공간
\(S\)를 집합이라 하고 \(V\)를 \(\mathbb{F}\) 위의 벡터공간이라 하자. \(S\)에서 \(V\)로의 함수들의 집합을 \(F(S,\,V)\)로 나타낸다. 임의의 \(\alpha \in \mathbb{F}\)와 임의의 \(f,\,g \in F(S,\,V)\)에 대해, \(F(S,\,V)\)에서의 함수 \(f + g\)와 \(\alpha f\)를 다음과 같이 정의한다. \[\begin{aligned} \forall x \in V : \, (f + g)(x) &= f(x) + g(x),\\[6pt] \forall x \in V : \, (\alpha f)(x) &= \alpha f(x). \end{aligned}\] 이와 같이 정외된 벡터 합과 스칼라 곱이 주어진 집합 \(F(S,\,V)\)는 \(\mathbb{F}\) 위의 벡터공간이 된다.
만약 \(S\)가 정수 집합 \(\{1,\,\ldots,\,k\}\)라면 집합 \(F(S,\,\mathbb{F})\)는 공간 \(\mathbb{F}^k\)와 동일시될 수 있다. 즉 각 원소 \(x \in \mathbb{F}^k\)를 \[f(j) = x_j ,\,\, 1\le j\le k\] 라고 정의된 함수 \(f \in F(S,\,\mathbb{F})\)에 대응시킴으로써, 두 공간은 동일한 구조를 가짐을 알 수 있다.
선형변환
선형변환의 개념
\(V,\) \(W\)를 동일한 체 \(\mathbb{F}\) 위의 벡터공간이라 하자. 함수 \(T : V \to W\)가 선형변환(linear transformation)이라는 것은, 임의의 \(\alpha,\,\beta \in \mathbb{F}\)와 \(x,\,y \in V\)에 대해, \[T(\alpha x + \beta y) = \alpha T(x) + \beta T(y)\] 가 성립하는 것을 뜻한다. 선형변환을 선형사상이라고 부르기도 한다.
\(V\)에서 \(W\)로의 모든 선형변환의 집합을 \(L(V,\,W)\)로 표기한다. 공역이 벡터공간인 함수를 모은 함수공간은 벡터공간이므로 \(L(V,\,W)\)는 벡터공간이다. 또한 이 공간은 \(F(V,\,W)\)의 부분공간이다. \(V = W\)인 경우 \(L(V,\,V)\)를 \(L(V)\)로 줄여 쓴다.
\(L(V)\)에서 특히 간단한 선형변환은 \[I_V (x) = x,\,\, x \in V\]로 정의된다. 이를 \(V\) 위의 항등변환이라고 부른다. 항등변환의 정의역이 명확하여 혼동할 염려가 없으면, \(I_V\)를 간단히 \(I\)로 나타낸다.
선형변환의 합성
\(V,\) \(W,\) \(X\)가 벡터공간이고 \(T \in L(V,\,W)\), \(S \in L(W,\,X)\)라고 하자. 그러면 합성함수 \(S\circ T\)는 선형변환이다. 즉 \(S \circ T \in L(V,\,X)\)이다.
선형변환의 합성은 대수적으로 유용한 성질을 가진다. \(V\)가 벡터공간이라 하고 \(R,\,S,\,T \in L(V)\)이며 \(\alpha \in \mathbb{F}\)라 하자. 그러면 다음이 성립한다.
- \(R \circ (S \circ T) = (R \circ S) \circ T.\)
- \(R \circ (S + T) = R \circ S + R \circ T.\)
- \((S + T) \circ R = S \circ R + T \circ R.\)
- \(I_V \circ T = T \circ I_V = T.\)
- \((\alpha S) \circ T = \alpha (S \circ T) = S \circ (\alpha T).\)
이러한 성질들은 합성 연산이 정의되는 경우 서로 다른 공간 사이의 선형변환에 대해서도 성립한다.
선형변환의 기본성질
\(V,\) \(W\)가 벡터공간이라 하고 \(T \in L(V,\,W)\)라 하자. 이때 다음이 성립한다.
- \(T(0) = 0\).
- \(U\)가 \(V\)의 부분공간이면 집합 \(T(U)\)는 \(W\)의 부분공간이고 \(\dim T(U) \leq \dim U\)이다.
- \(U\)가 \(W\)의 부분공간이면 집합 \(\{x \in V \,\vert\, T(x) \in U\}\)는 \(V\)의 부분공간이다.
선형변환과 관련된 부분공간
\(V,\) \(W\)가 벡터공간이라 하고 \(T \in L(V,\,W)\)라 하자.
- \(T\)의 상(image)은 부분공간 \(\operatorname{Im} T = T(V)\)이다. (\(T\)의 상을 \(T\)의 치역(range)이라고 부르기도 한다.) \(T\)의 계수(rank)는 수 \(r(T) = \dim(\operatorname{Im} T)\)이다. (계수를 랭크 또는 차수라고 부르기도 한다. 또한 \(r(T)\)를 \(\operatorname{rank}(T)\)와 같이 나타내기도 한다.
- \(T\)의 핵(kernel)은 부분공간 \(\operatorname{Ker} T = \{x \in V : T(x) = 0\}\)이다. (\(T\)의 핵을 \(T\)의 영공간(null space) 또는 커널이라고 부르기도 한다.) \(T\)의 영차수(nullity)는 수 \(n(T) = \dim(\operatorname{Ker} T)\)이다. (영차수를 퇴화차수 또는 널리티라고 부르기도 한다. 또한 \(n(T)\)를 \(\operatorname{nullity}(T)\)로 나타내기도 한다.)
- 계수와 영차수 \(\operatorname{rank}(T),\) \(\operatorname{nullity}(T)\)는 각각 무한대일 수 있다.
- \(T\)가 유한 계수를 가진다는 것은 \(\operatorname{rank}(T)\)가 유한한 것이다.
- \(T\)가 일대일 선형변환(one-to-one linear transformation)이라는 것은, 임의의 \(y \in W\)에 대해, 방정식 \(T(x) = y\)가 많아야 하나의 해 \(x\)를 가지는 것이다. 일대일 선형변환을 단사(injective) 선형변환이라고 부르기도 한다.
- \(T\)가 \(W\) 위로의 선형변환(linear transformation onto \(W\))이라는 것은, 임의의 \(y \in W\)에 대해, 방정식 \(T(x) = y\)가 적어도 하나의 해 \(x\)를 가지는 것이다. 공역 위로의 선형변환을 전사(surjective) 선형변환이라고 부르기도 한다.
- \(T\)가 일대일대응(one-to-one correspondence)이라는 것은, 임의의 \(y \in W\)에 대해, 방정식 \(T(x) = y\)가 정확히 하나의 해 \(x\)를 가지는 것이다. 즉 \(T\)가 일대일대응이라는 것은 일대일이면서 위로의 선형변환임을 뜻한다. 일대일대응을 전단사(bijective)라고 부르기도 한다.
선형변환의 영차수 및 계수와 관련된 성질
선형변환의 영차수 및 계수와 관련하여 다음이 성립한다. \(V,\) \(W\)가 벡터공간이라 하고 \(T \in L(V,\,W)\)라 하자.
- \(T\)가 일대일일 필요충분조건은 방정식 \(T(x) = 0\)이 자명한 해 \(x = 0\)만을 가지는 것이다. 이는 \(\operatorname{Ker} T = \{0\}\) 또는 \(\operatorname{nullity}(T) = 0\)과 동치이다.
- \(T\)가 위로의 선형변환일 필요충분조건은 \(\operatorname{Im} T = W\)인 것이다. \(\dim W\)가 유한이면, 이는 \(\operatorname{rank}(T) = \dim W\)와 동치이다.
- \(T \in L(V,\,W)\)가 일대일대응일 필요충분조건은 유일한 변환 \(S \in L(W,\,V)\)가 존재하여 이 변환이 일대일대응이고 \(S \circ T = I_V\)이며 \(T \circ S = I_W\)인 것이다.
- 만약 \(V\)가 \(k\)차원이면 \[\operatorname{rank}(T) + \operatorname{nullity}(T) = k\] 가 성립한다. 이를 ‘차원 정리’ 또는 ‘Rank-Nullity 정리’라고 부른다. 이 정리에서 \(\operatorname{rank}(T)\)는 \(W\)의 차원이 유한인지 여부와 상관없이 반드시 유한하다. 만약 \(W\) 또한 \(k\)차원이면, \(T\)가 일대일대응일 필요충분조건은 \(\operatorname{nullity}(T) = 0\)인 것이다.
선형변환의 행렬표현
\(U\)와 \(V\)가 동일한 체 위에서 정의된 유한차원 벡터공간이고, 이들의 차원이 양의 정수 \(n,\) \(m\)이라고 하자. 그리고 \(U,\) \(V\)에 각각 기저 \[\begin{aligned} \mathbf{u} &= \left\{ u_1 ,\, u_2 ,\, \ldots ,\, u_n \right\}, \\[6pt] \mathbf{v} &= \left\{ v_1 ,\, v_2 ,\, \ldots ,\, v_m \right\} \end{aligned}\] 이 주어졌다고 하자. 또한 \(T:U \rightarrow V\)를 선형변환이라고 하자. 이때 각 \(u_j ,\) \(j=1,\,2,\,\ldots ,\, n\)에 대하여 \(T(u_j )\)를 기저 \(\mathbf{v}\)를 기준으로 나타냈을 때 \(i\)째 성분 \(a_{ij}\)를 성분으로 갖는 \(m\times n\) 행렬을 \(\mathbf{u}\)와 \(\mathbf{v}\)에 대한 \(T\)의 행렬표현(matrix representation)이라고 부르고 \(M_{\mathbf{u}}^{\mathbf{v}} (T )\) 또는 \([ T ] _{\mathbf{u}}^{\mathbf{v}} \)와 같이 나타낸다. \(x\in U\)와 \(y\in V\)에 대하여 \(y=T(x)\)일 때 \[[y]_{\mathbf{v}} = [ T ] _{\mathbf{u}}^{\mathbf{v}} \, [x]_{\mathbf{u}} \] 즉 \[[T(x)]_{\mathbf{v}} = [ T ] _{\mathbf{u}}^{\mathbf{v}} \, [x]_{\mathbf{u}} \] 가 성립한다. 여기서 우변은 행렬곱이다.
선형변환의 행렬표현은 다음과 같은 성질을 가진다.
- 대응 \(T \mapsto M_{\mathbf{u}}^{\mathbf{v}}(T)\)는 \(L(U,\,V)\)에서 \(M_{mn}(\mathbb{F})\)로의 일대일대응인 선형변환이다. 즉, \(S,\,T \in L(U,\,V)\)이고 \(\alpha \in \mathbb{F}\)이면, \[\begin{aligned} M_{\mathbf{u}}^{\mathbf{v}}(\alpha T) &= \alpha M_{\mathbf{u}}^{\mathbf{v}}(T),\\[6pt] M_{\mathbf{u}}^{\mathbf{v}}(S + T) &= M_{\mathbf{u}}^{\mathbf{v}}(S) + M_{\mathbf{u}}^{\mathbf{v}}(T) \end{aligned}\] 가 성립한다.
- \(W\)가 \(l\)차원 벡터공간이며, 기저 \(\mathbf{w}\)를 가진다고 하자. 또한 \(T \in L(U,\,V),\) \(S \in L(V,\,W)\)라고 하자. 이때 \[M_{\mathbf{u}}^{\mathbf{w}}(ST) = M_{\mathbf{v}}^{\mathbf{w}}(S)M_{\mathbf{u}}^{\mathbf{v}}(T)\] 가 성립한다.
유한차원 벡터공간 사이에서 정의된 선형변환을 행렬로 나타낼 수 있는 것처럼, 행렬을 곱하는 연산을 통해 선형변환을 정의할 수 있다. 이 두 가지 변환은 서로 완전히 역대응 관계이다. 즉 \(\mathbf{u}\)를 \(\mathbb{F}^n\)의 표준기저라 하고 \(\mathbf{v}\)를 \(\mathbb{F}^m\)의 표준기저라 하자. 또한 \(C \in M_{mn}(\mathbb{F})\)이고 \(T \in L(\mathbb{F}^n,\,\mathbb{F}^m)\)이라 하자. 그러면 다음이 성립한다.
- \(M_{\mathbf{u}}^{\mathbf{v}}(T_C) = C .\)
- \(T_B = T.\) (여기서 \(B = M_{\mathbf{u}}^{\mathbf{v}}(T)\)이다.)
좌표변환행렬
벡터공간 \(V\)의 차원이 양의 정수 \(k\)이고 \(I\in L(V)\)가 항등변환이며, \(\mathbf{u}\)와 \(\mathbf{v}\)가 각각 \(V\)의 기저라고 하자. 그러면 임의의 벡터 \(x\in V\)에 대하여 \[ [x]_{\mathbf{v}} = [I]_{\mathbf{u}}^{\mathbf{v}} [x]_{\mathbf{u}} \] 가 성립한다. 즉 항등변환의 행렬표현 \([I]_{\mathbf{u}}^{\mathbf{v}}\)는 기저 \(\mathbf{u}\)에 대한 벡터 \(x\)의 좌표를 기저 \(\mathbf{v}\)에 대한 벡터 \(x\)의 좌표로 변환해주는 행렬이 된다. 이때 \([I]_{\mathbf{u}}^{\mathbf{v}}\)를 좌표변환행렬(transition matrix)이라고 부르고 \(P_{\mathbf{u} \rightarrow \mathbf{v}}\)와 같이 나타낸다.
두 벡터공간 \(U\)와 \(V\)의 차원이 각각 양의 정수 \(n,\) \(m\)이고, \(\mathbf{u}_1\)과 \(\mathbf{u}_2\)가 \(U\)의 기저이며, \(\mathbf{v}_1\)과 \(\mathbf{v}_2\)가 \(V\)의 기저라고 하자. 또한 \(T\in L(U,\,V)\)라고 하자. 이때 다음이 성립한다. \[ [T]_{\mathbf{u}_2}^{\mathbf{v}_2} = P_{\mathbf{v}_1 \rightarrow \mathbf{v}_2} \, [T]_{\mathbf{u}_1}^{\mathbf{v}_1} \, P_{\mathbf{u}_2 \rightarrow \mathbf{u}_1} . \]
닮은행렬
\(A\)와 \(B\)가 \(k\times k\) 정사각행렬이라고 하자. 만약 \(k\times k\) 가역행렬 \(P\)가 존재하여 \[B = P^{-1} A P\] 를 만족시키면, \(A\)와 \(B\)를 닮은행렬(similar matrix)이라고 부른다.
벡터공간 \(V\)가 \(k\)차원이고 \(V\)에 기저 \(\mathbf{v}_1\)과 \(\mathbf{v}_2\)가 주어졌으며 \(T\in L(V)\)라고 하자. 또한 \[\begin{aligned} A &= [T]_{\mathbf{v}_1}^{\mathbf{v}_1} ,\\[6pt] B &= [T]_{\mathbf{v}_2}^{\mathbf{v}_2} ,\\[6pt] P &= P_{\mathbf{v}_2 \rightarrow \mathbf{v}_1 } \end{aligned}\] 이라고 하자. 그러면 \[ [T]_{\mathbf{v}_2}^{\mathbf{v}_2} = ( P_{\mathbf{v}_2 \rightarrow \mathbf{v}_1} )^{-1} \, [T]_{\mathbf{v}_1}^{\mathbf{v}_1} \, P_{\mathbf{v}_2 \rightarrow \mathbf{v}_1} \] 즉 \[B = P^{-1} A P\] 가 성립한다. 이러한 관점으로 보았을 때, 두 정사각행렬 \(A\)와 \(B\)가 닮은행렬이라 함은 \(A\)와 \(B\)가 한 선형변환의 다른 행렬표현임을 뜻한다.
고윳값과 고유벡터
고윳값과 고유벡터
\(V\)를 벡터공간이라 하고 \(T \in L(V)\)라 하자. 스칼라 \(\lambda \in \mathbb{F}\)가 \(T\)의 고윳값(eigenvalue)이라는 것은 방정식 \(T(x) = \lambda x\)가 자명하지 않은 해(\(0\)이 아닌 해) \(x \in V\)를 가지는 것이다. 이때 그러한 비자명해를 \(\lambda\)에 대응되는 \(T\)의 고유벡터(eigenvector)라고 부른다. 부분공간 \(\operatorname{Ker}(T - \lambda I) \subset V\)를 \(\lambda\)에 대응하는 고유공간(eigenspace)이라 부른다. 이때 \(\lambda\)의 중복도(multiplicity)를 수 \(m_\lambda = \operatorname{nullity}(T - \lambda I)\)로 정의한다.
특성다항식
\(V\)의 차원이 양의 정수이고 \(\mathbf{b}\)가 \(V\)의 기저이며 \(T\in L(V)\)이고 \(A = [T]_{\mathbf{v}}\)라고 하자. 이때 \[p_T (\lambda) = \det(tI-A)\] 는 \(t\)에 대한 \(k\)차 다항식이 된다. 이 다항식을 \(T\)의 특성다항식(characteristic polynomial) 또는 \(A\)의 특성다항식이라고 부른다. 또한 방정식 \(p(t) = 0\)을 \(T\)의 특성방정식(characteristic equation) 또는 \(A\)의 특성방정식이라고 부른다. \(V\)의 기저 \(\mathbf{b}\)에 따라 \(T\)의 행렬표현 \(A\)는 달라질 수 있지만 \(T\)의 특성다항식 \(p_T (t)\)는 달라지지 않는다.
선형변환 \(T\)의 특성다항식이 \(p_T (t)\)일 때, \(\lambda\)가 \(T\)의 고윳값이 되기 위한 필요충분조건은 \(\lambda\)가 특성방정식 \(p_T (t)=0\)의 해인 것이다.
해의 범위가 \(\mathbb{R}\)인지 \(\mathbb{C}\)인지 여부에 따라 방정식의 해가 달라질 수 있다. 즉 특성방정식의 해는 \(\mathbb{F} = \mathbb{R}\)인 경우와 \(\mathbb{F} = \mathbb{C}\)인 경우 달라질 수 있다. 그러므로 체를 어느 것으로 정하느냐에 따라 \(T\)의 고윳값이 달라질 수 있다.
\(\lambda\)가 \(T\)의 고윳값이고, \(T\)의 특성다항식 \(p_T (t)\)가 인수 \((t-\lambda)^m\)을 갖지만 \((t-\lambda)^{m+1}\)은 인수로 갖지 않을 때, \(m\)을 고윳값 \(\lambda\)의 대수적 중복도(algebraic multiplicity)라고 부른다.
집합 \(E_\lambda = \left\{ x\in V \,\vert\, T(x) = \lambda x \right\}\) 는 \(V\)의 부분공간이 되는데, 이 공간 \(E_\lambda\)를 고윳값 \(\lambda\)에 대응되는 고유공간(eigenspace)이라고 부른다. 이때 \(E_\lambda\)의 차원을 고윳값 \(\lambda\)의 기하적 중복도(geometric multiplicity) 또는 간단하게 중복도라고 부른다.
고윳값과 고유벡터의 성질
\(V\)를 \(n\)차원 벡터공간이라 하고 \(T \in L(V)\)라 하자. \(\{\lambda_1,\,\ldots,\,\lambda_k\}\)를 \(T\)의 서로 다른 고윳값들의 집합이라 하고, 각 \(j=1,\,2,\,\ldots,\,k\)에 대해 \(x_j\)를 \(\lambda_j\)에 대응하는 고유벡터라 하자. 그러면 집합 \(\{x_1,\,\ldots,\,x_k\}\)는 일차독립이다.
각 고윳값 \(\lambda_j\)에 대응되는 일차독립인 \(m_j\)개의 고유벡터 \[x_{j,1} ,\, x_{j,2} ,\, \ldots ,\, x_{j,m_j}\] 가 존재한다. 이때 이 벡터는 \(\lambda_j\)의 고유공간 \(E_{\lambda_j}\)의 기저가 된다. 만약 서로 다른 고윳값 \(\lambda_j\)에 대하여 \[m_1 + m_2 + \ldots + m_k = n\] 이면 각 고윳값에 대응되는 고유벡터를 모두 모은 다음과 같은 벡터들은 \(V\)의 기저를 이룬다. \[\begin{gathered} x_{1,1} ,\, x_{1,2} ,\, \ldots ,\, x_{1,m_1} ,\\[6pt] x_{2,1} ,\, x_{2,2} ,\, \ldots ,\, x_{2,m_2} ,\\[6pt] \vdots \\[6pt] x_{k,1} ,\, x_{k,2} ,\, \ldots ,\, x_{k,m_k} . \end{gathered}\] 즉 \[V = E_{\lambda_1} \oplus E_{\lambda_2} \oplus \cdots \oplus E_{\lambda_k}\] 가 성립한다. 이와 같은 기저를 \(T\)에 대한 \(V\)의 고유기저(eigenbasis)라고 부른다.
대각화
\(V\)가 \(n\)차원 벡터공간이고 \(T\in L(V)\)이며 \(T\)의 각 고윳값의 대수적 중복도와 기하적 중복도가 일치한다고 하자. 그리고 \(T\)에 대한 \(V\)의 고유기저가 다음과 같다고 하자. \[\mathbf{b} = \left\{ x_1 ,\, x_2 ,\, \cdots ,\, x_n \right\}.\] 이때 기저 \(\mathbf{b}\)에 대한 \(T\)의 행렬표현 \([ T ] _{\mathbf{b}}\)는 고윳값을 대각성분으로 갖는 \(n\times n\) 대각행렬이 된다. 이처럼 \([ T ] _{\mathbf{b}}\)가 대각행렬이 되도록 하는 \(V\)의 기저 \(\mathbf{b}\)가 존재할 때, “\(T\)는 대각화 가능하다(diagonalizable)”라고 말한다.
\(A\)가 \(n\times n\) 행렬이라고 하자. 그러면 벡터공간 \(\mathbb{F} ^n\)의 표준기저 \(\mathbf{e}\)에 대하여 \[T(x) = A \,[x]_{\mathbf{e}}\] 라고 정의함으로써 \(T\)는 정의역과 공역이 \(\mathbb{F} ^n\)인 선형변환이다. 만약 \(T\)가 대각화 가능하고 \(\mathbf{b}\)가 \([T]_{\mathbf{b}}\)가 대각행렬이 되도록 하는 고유기저라면 \[ A = [T]_{\mathbf{e}} = (P_{\mathbf{e} \rightarrow \mathbf{b}})^{-1} \, [T]_{\mathbf{b}} \, P_{\mathbf{e} \rightarrow \mathbf{b}}\] 가 성립한다. 여기서 \(D = [T]_{\mathbf{b}} ,\) \(P = P_{\mathbf{e} \rightarrow \mathbf{b}}\)라고 하면 \(D\)는 대각행렬이고 \[A = P^{-1} D P\] 가 성립한다. 위 식의 우변을 행렬 \(A\)의 대각화(diagonalization)라고 부른다. 또한 행렬 \(A = [T]_\mathbf{e}\)가 대각화 가능하다는 것은 선형변환 \(T\)가 대각화 가능하다는 것과 같은 의미로 정의한다.
\(\mathbb{F} = \mathbb{R}\)일 때 행렬 \(A\)가 대각화 가능하면 “\(A\)는 실대각화 가능하다”라고 말하며, \(\mathbb{F} = \mathbb{C}\)일 때 행렬 \(A\)가 대각화 가능하면 “\(A\)는 복소대각화 가능하다”라고 말한다.
내적(inner product)의 개념을 도입하고 벡터의 직교성(orthogonality)을 정의한 뒤 선형변환과 행렬의 직교대각화 가능성을 논할 수 있다. 그리고 대각화 불가능한 행렬의 경우 조르단 표준형(Jordan canonical form)을 사용하여 대각화에 가까운 형태로 변형할 수 있다. 또한 정사각행렬이 아닌 행렬의 경우 특잇값 분해(singular value decomposition)를 시도할 수 있다.