주성분분석 예제

By 2019. augusztus 2. Egyéb kategória No Comments

PCA는 진정한 고유 벡터 기반 다변량 분석 중 가장 간단합니다. 종종 그 작업은 데이터의 분산을 가장 잘 설명하는 방식으로 데이터의 내부 구조를 드러내는 것으로 생각할 수 있습니다. 다변량 데이터 집합이 고차원 데이터 공간(변수당 1축)의 좌표 집합으로 시각화되는 경우 PCA는 사용자에게 가장 유익한 관점에서 볼 때 이 개체의 투영인 을 낮은 차원의 그림으로 제공할 수 있습니다[인용]. 필요]. 이 작업은 변환된 데이터의 차원을 줄이기 위해 처음 몇 개의 주요 구성 요소만 사용하여 수행됩니다. 독립적인 구성요소 분석(ICA)은 주성분 분석과 유사한 문제를 대상으로 하지만 연속적인 근사치가 아닌 추가 분리 가능한 구성요소를 찾습니다. 첫 번째 주 성분을 효율적으로 계산하는 한 가지 방법은 공변행렬을 계산하지 않고 평균이 0인 데이터 행렬 X에 대해 다음 의사 코드에 표시됩니다. 주 성분 분석(PCA)은 주식 시장 예측, 유전자 발현 데이터 분석 등과 같은 다양한 응용 분야에서 사용되는 간단하면서도 인기 있고 유용한 선형 변환 기술입니다. 이 튜토리얼에서, 우리는 PCA가 단지 “블랙 박스”가 아니라는 것을 볼 수 있습니다, 우리는 3 가지 기본 단계에서 내부를 해명하려고합니다. 두 번째 주성분은 첫 번째 주 성분과 상관관계가 없고 다음 으로 가장 높은 분산을 차지한다는 조건과 동일한 방식으로 계산됩니다. 신경 과학에서, PCA는 또한 그것의 활동 잠재력의 모양에서 뉴런의 정체성을 분별 하는 데 사용 됩니다.

세포외 기록 기술은 종종 하나 이상의 뉴런에서 신호를 픽업하기 때문에 스파이크 정렬은 중요한 절차입니다. 스파이크 정렬에서 먼저 PCA를 사용하여 활동 잠재 파형 공간의 치수를 줄인 다음 클러스터링 분석을 수행하여 특정 동작 전위를 개별 뉴런과 연결합니다. 주 성분 변환은 또한 다른 행렬 분해, X의 특이값 분해 (SVD)와 연관 될 수있다, 고유 벡터의 순서로 순위에 의해, 가장 높은 에서 가장 낮은, 당신은 에서 주 성분을 얻을 중요성의 순서.