행렬의 특성다항식

by Ariel Daley

특성다항식의 정의와 계산

고윳값(eigenvalue)을 찾는 과정에서 핵심이 되는 것이 바로 특성다항식(characteristic polynomial)이다. 행렬 \(A\)의 특성다항식이란 방정식 \(\det(A - \lambda I) = 0\)의 좌변을 전개하면 생기는 \(\lambda\)에 관한 다항식을 가리키는데, 이 방정식의 근(roots)이 곧 행렬의 고윳값이 된다. 특성다항식의 성질을 잘 파악하면 고윳값 계산이나 대각화 과정이 한결 체계적으로 이뤄진다.

정의 1. (특성다항식)

\(n \times n\) 행렬 \(A\)에 대하여, 다음과 같은 \(\lambda\)-변수 행렬식을 생각한다. \[ \det(A - \lambda I) \] 이때, \[ p_A(\lambda) \;=\; \det(A - \lambda I) \] 를 행렬 \(A\)의 특성다항식(characteristic polynomial)이라 부른다.

즉, “단위행렬의 스칼라배 \(\lambda I\)를 빼는 연산”을 통해 \(\det(A - \lambda I)\)가 만들어지고, 이것을 \(\lambda\)에 대한 다항식으로 간주한다. 이 다항식은 보통 \(\lambda\)에 대한 \(n\)차 다항식이 되며, 계수는 행렬 \(A\)의 원소에 의해 결정된다.

특성다항식의 예

  • 2×2 행렬 \[ A = \begin{pmatrix} a & b \\ c & d \end{pmatrix}. \] 그러면 \[ p_A(\lambda) = \det \begin{pmatrix} a - \lambda & b \\ c & d - \lambda \end{pmatrix} = (a - \lambda)(d - \lambda) - bc. \] 이를 전개하면 \[ p_A(\lambda) = \lambda^2 - (a + d)\lambda + (ad - bc). \] 따라서 2차 다항식이 형성되고, 여기서의 근 \(\lambda\)들이 곧 \(A\)의 고윳값이다.
  • 3×3 행렬 \[ A = \begin{pmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33} \end{pmatrix}. \] 이 경우, \[ p_A(\lambda) = \det\!\bigl(A - \lambda I\bigr) = \det \begin{pmatrix} a_{11} - \lambda & a_{12} & a_{13} \\ a_{21} & a_{22} - \lambda & a_{23} \\ a_{31} & a_{32} & a_{33} - \lambda \end{pmatrix}. \] 이는 일반적으로 3차 다항식을 이룬다. 세 근(중복 근 가능)이 곧 고윳값 후보가 된다.

물론 \(n \times n\) 차원으로 올라가면 \(\lambda\)에 대한 \(n\)차 다항식이 생성되며, 이를 직접 전개하는 것은 부담이 클 수 있다. 그래도 개념적으로 “특성다항식을 풀어(근을 구해) 고윳값을 찾는다”는 절차는 동일하다.

특성다항식을 계산할 시 주의할 점

  • 중복근(Multiplicity): 특성다항식이 \((\lambda - \lambda_0)^k\) 형태의 인수를 가질 수 있다. 이때 \(\lambda_0\)은 ‘중복 고윳값’으로 불리며, 이후 대각화나 Jordan 표준형 등을 논할 때 중요한 역할을 한다.
  • 계수 부호·추가 공식: \(p_A(\lambda)\)를 전개하면 \(\lambda^n\), \(\lambda^{n-1}\) 등 여러 항이 나타난다. 최고차항의 계수는 항상 \((-1)^n\)이며, \(\lambda^{n-1}\) 항의 계수는 \(-(\mathrm{trace}(A))\), 상수항은 \((-1)^n \det(A)\)와 같은 패턴으로 정리된다.
  • 실수 행렬 vs 복소수 행렬: 실수 행렬이라 해도, 특성다항식의 근은 복소수 범위에서만 찾을 수 있는 경우도 있다(실근이 없는 경우). 고윳값이 반드시 실수가 아닐 수도 있다는 점을 유의해야 한다.

특성다항식 \(\det(A - \lambda I)\)는 행렬 \(A\)가 갖는 고윳값의 집합을 거의 결정해 주는 핵심적인 식이다. 즉, 이 한 함수(다항식)를 잘 이해하면, 고윳값이 무엇인지, 중복도는 얼마인지 등을 파악할 수 있고, 그로부터 고유벡터 계산, 대각화 가능성, Jordan 표준형 등의 응용으로 뻗어 나갈 수 있다.

특성다항식의 근과 고윳값의 관계

특성다항식 \(p_A(\lambda) = \det(A - \lambda I)\)는 행렬 \(A\)가 갖는 고윳값을 \(\lambda\)-변수에 대한 다항식 형태로 표현한 것이다. 방정식 \[\det(A - \lambda I)=0\] 의 근(roots)이 바로 행렬 \(A\)의 고윳값이 되며, 이를 통해 고윳값을 체계적으로 찾을 수 있다.

기본적으로, 다음 두 진술이 동치라는 사실을 이해하는 것이 핵심이다.

  1. \(\lambda\)는 행렬 \(A\)의 고윳값이다, 즉 \(A\mathbf{v} = \lambda \mathbf{v}\)를 만족하는 \(\mathbf{v} \neq \mathbf{0}\)가 존재한다.
  2. \(\lambda\)는 특성다항식의 근이다, 즉 \(\det(A - \lambda I)=0\)이다.

왜냐하면, 고유벡터 \(\mathbf{v}\neq\mathbf{0}\)가 존재하려면 \((A - \lambda I)\mathbf{v} = \mathbf{0}\)라는 방정식에 비자명해(영이 아닌 벡터인 해)가 있어야 하고, 이는 \(\mathrm{Ker}(A - \lambda I)\neq \{\mathbf{0}\}\)임을 뜻한다. 따라서 행렬 \((A - \lambda I)\)는 가역이 아니고, 따라서 \(\det(A - \lambda I) = 0\)이 성립한다. 이 과정을 “\(\lambda\)가 \(A\)의 고윳값이다 ⇔ \(\det(A - \lambda I)=0\)”로 요약할 수 있다.

중복근과 고윳값의 중복도

행렬의 특성다항식을 전개하다 보면, 특정 \(\lambda_0\)가 여러 번 등장하는 “중복근(multiple root)” 상황이 발생할 수 있다. 예를 들어, \[ p_A(\lambda) = (\lambda - 2)^2(\lambda + 1) \cdots \] 처럼 인수 \((\lambda - 2)\)가 2차로 나타나면, \(\lambda=2\)는 “중복도가 2인 고윳값”으로 취급된다. 이를 보통 다음 두 관점에서 해석한다.

  • 대수적 중복도(Algebraic Multiplicity): 특성다항식에서 해당 \((\lambda - \lambda_0)\) 인수가 몇 번 반복되는지 세는 것으로 정의된다. 예: 위 예시에서 \(\lambda=2\)의 대수적 중복도는 2이다.
  • 기하적 중복도(Geometric Multiplicity): \((A - \lambda_0 I)\mathbf{v}=\mathbf{0}\)의 해공간(고유벡터 공간) 차원을 의미한다. 대수적 중복도만큼 다차원 고유벡터 공간이 꼭 확보되는 것은 아니며, 일반적으로 기하적 중복도는 대수적 중복도 이하의 값이다. (이 후에 Jordan 표준형 등에서 자세히 살핀다.)

특히 “행렬이 대각화(diagonalizable)될 수 있느냐”를 판단할 때, 모든 고윳값에 대해 “대수적 중복도 = 기하적 중복도”가 성립해야 한다는 점이 중요하다. 이는 뒤에서 자세히 다룰 대각화 이론과 밀접한 관련이 있다.

복소 근과 실수 근

행렬 \(A\)가 실수 원소로 이뤄져 있어도, 특성다항식의 근이 전부 실수라는 보장은 없다. 예컨대 2×2 회전 행렬처럼 \(\mathbb{R}\)에서 근이 전혀 안 나오는 경우(회전행렬의 특성다항식이 \(\lambda^2+1=0\) 꼴)도 있을 수 있다. 따라서 고윳값을 논의할 때는 경우에 따라 복소수 범위에서 생각하는 일이 일반적이다.

  • 실근이 없는 경우: 예를 들어 헹랼 \(\begin{pmatrix}0 & -1\\ 1 & 0\end{pmatrix}\)의 고윳값은 \(\pm i\)이다. 이는 실수 범위에서 해를 찾을 수 없음을 뜻하지만, 복소수 차원에서 해당 고윳값이 존재한다.
  • 실수 고윳값: 중점적 응용(대각화 등)에서 “행렬이 실수이고 고윳값도 실수”인 케이스를 많이 다룬다. 이때는 해석이 훨씬 단순해진다.

결국 특성다항식 \(\det(A - \lambda I)\)의 \(\lambda\)는 곧 \(A\)의 고윳값이 된다. 이 근이 중복되는 경우엔 그만큼 대수적 중복도가 있고, 이에 상응하는 고유벡터 공간(기하적 중복도)이 존재한다. 나아가 실수 벡터공간인지, 복소수 벡터공간인지에 따라 해석이 조금 달라질 수 있다. 하지만 핵심 원리는 “\(\lambda\)가 행렬 \(A\)의 고윳값이다 ⇔ \((A - \lambda I)\mathbf{v}=0\)의 비자명 해가 존재한다 ⇔ \(\det(A - \lambda I)=0\)” 하나로 요약된다.

다음 단계에서는 이렇게 구한 고윳값들을 활용해, 행렬을 보다 간단한 형태(대각화)로 바꿀 수 있는지, 그 기준이 무엇인지를 다루게 된다. 이는 선형대수학의 큰 목표 중 하나인 “복잡한 변환을 간단한 변환으로 표현하는 법”의 핵심 열쇠를 쥐고 있다.