고유값 분해는 어떤 행렬을 그 행렬의 고유값과 고유벡터로 구성된 여러 개의 행렬들로 구성된 식을 이용하여 나타내는 방법이다.
고유값과 고유벡터
고유값과 고유벡터는 다음과 같이 정의된다.
행렬 A와 스칼라 λ∈R, 그리고 영벡터가 아닌 벡터 e∈Rn에 대해 다음 조건을 만족할 때, λ는 A의 고유값(eigenvalue)이고, e는 A의 고유벡터(eigenvector)이다.
Ae = λe
일반적으로 n차원 행렬에 대해 고유값은 n개 이하만큼 존재하며, 각각의 서로 다른 고유값은 서로 다른 벡터공간을 생성한다.
고유값 분해
고유값 분해는 n차원 행렬을 n개의 고유벡터를 서로 독립인 열벡터로 가지는 행렬 S와, S의 각 열벡터에 대응하는 고유값을 대각 원소로 삼는 대각 행렬 Λ, 그리고 S의 역행렬, 이 세 행렬의 곱으로 표현한다. 즉,
A = SΛS-1
그러나 S가 역행렬이 존재하지 않을 수 있기에, 보다 일반화된 형식은 다음과 같다.
AS = SΛ
몇 개의 고유값을 선택하느냐에 따라, 하나의 행렬이 만들어내는 열공간에 속하는 벡터들을 오차범위 이내에서 더 낮은 차원으로 근사할 수 있다. 선택하는 고유값의 개수가 많을수록, 일반적으로 오차는 줄어든다.