티스토리 툴바


'Machine Learning'에 해당되는 글 11건

  1. 2009/11/13 PCA(Principal Components Analysis)

주성분 분석법 (Principle Components Analysis)

 

주성분 분석법은 앞에서 설명한 전통 다차원 척도법과 유사한 데이터 분석 방법으로, 고차원의 데이터에서 특정 패턴(pattern)을 찾거나 데이터간의 유사한 점이나 차이점을 찾기 위한 통계적 방법이다. 이는 다차원의 벡터들로 이루어진 데이터에 대해 원래 차원에서의 정보를 최대한 유지하면서 벡터들의 차원을 낮은 차원으로 변환시키는 것으로 데이터 분석을 위해 많이 사용된다. 이러한 주성분 분석은 고차원의 데이터를 정보손실 없이 낮은 차원으로 변환해주는 장점으로 인해 현재 얼굴인식 등의 분야에서 사용되고 있다. 이러한 주성분 분석은 다음과 같이 다섯 단계를 거치게 된다.

  1. 고차원의 벡터 X의 각 차원에 대해 평균 mj를 계산하고 각 차원의 값 xi에 대해 해당 차원의 mj을 뺀 결과를 이용하여 mA행렬을 생성한다. (i: 객체의 수, j: 차원의 수)
  2. mA행렬에 대해 다음의 식을 이용하여 공분산 행렬을 생성한다. (X: 벡터의 X번째 차원, Y: 벡터의 Y번째 차원, n: 벡터의 개수, : X차원의 평균, : Y차원의 평균)

     3. 생성된 공분산 행렬에 대해 k개의 가장 큰 고유값들 λ1, , λk을 찾고 여기에 대응하는 고유벡터 e1, , ek을 구한다. (k: 표현하고자 하는 저차원의 차원 수)

   4. 계산한 고유벡터들을 활용하여 고유벡터 행렬 Ek를 아래와 같은 형태로 생성한다.

Ek = (eig1, eig2, eig3,…,eign) (eign: 고유벡터)

     5. n개의 개체들을 k차원의 공간에 표현하기 위한 좌표 행렬 X를 다음 수식을 이용하여 계산한다.

(Ek: k차원의 고유벡터 행렬)

이러한 과정을 거치는 주성분 분석법은 전통 다차원 척도법과 비교하였을 때 아래 그림과 같이 공통적인 부분과 차이점을 가진다.



'Machine Learning' 카테고리의 다른 글

PCA(Principal Components Analysis)  (0) 2009/11/13
Hamming Distance  (0) 2009/11/11
Sammon's Stress  (0) 2009/11/07
MNIST parser  (0) 2009/10/20
참고하면 좋을 블로그  (0) 2009/10/01
Dendrogram  (0) 2009/09/07
Posted by Jason Park
TAG
이전버튼 1 2 3 4 5 ... 11 이전버튼