STATA통계-주성분요인분석( part2)
안녕하세요 ^^ Ph.DRyu입니다
오늘은 주성분 분석 두 번째 이야기를 할 건데요.
(요인분석이 시간이 이렇게 많이 걸릴줄은 몰랐네요...;;;)
일단 시작했으니까 끝까지 내주세요. 시작하겠습니다!
sysuse auto, clear로 시작해보겠습니다!
…(1단계) 상관 분석
주성분요인 분석 전 확인합니다.피어슨의 상관계수를 한번 확인하는 것이 좋습니다.사람 분석이 상관계수, 상관계렬을 이용하기 때문인데 요인 분석 전에 요인 분석하는 변수 간의 상관계수를 파악해 주세요.
요인분석을 하기 위해서는 원시변수에서 적절한 요인을 찾기 위해 상관계수(Rho)가 상대적으로 높고 유의해야 합니다.여기서 상대적으로 높아야 한다고 했는데, 이 기준은 Hair et al. (2009) 연구에 의해서 0.3을 기준으로 한다고 하네요. 저는 4가지 변수의 요인 분석을 하겠습니다. 그래서 다음과 같이 상관계수로 살펴보았습니다.(상관계수뿐만 아니라 p-value에 의한 상관계수를 참조하십시오.)
pwcorr trunk weight length turn , sig star ( 0 . 01 )
1% 정도로 별을 띄워서 상관계수를 먼저 확인해 보세요보시면 중량변수와 길이변수는 거의 모든 변수와 강한 상관관계를 확인하실 수가 있죠.(2단계) 요인추출의 적절성검정(KMO: Kaiser-Meyer-Olkin, Bartlet's test of sphericity) KMO검정은? Part 1 에서 이야기를 했지만, 재차 말하면, "표본의 모든 변수에"공통"으로 간주되는"분산의 비율"을 확인하는 방법이다. 해당 검정을 통해 공통요인의 존재 여부를 판단할 수 있습니다.'해석은?해당하는검정통계량은0에서1사이의검정통계치가산출됩니다. 1에 가까울수록 변수가 높은 분산비율을 공유하고 있다는 뜻입니다. 하단의 실증분석 결과를 볼까요? 밑에 0.810 나오는 게 보여요 적절성이 높게 나타났습니다. (part1에 적절성 정도의 이야기가 있습니다.)
factortest trunk weight length turn
Bartlett's의 구형성 검정을 보면, 6차 자유도로 계산한 chi의 곱은 315.080으로, p-value는 1%이하에 유의함을 알 수 있었습니다. 상관행위가 동일한 차원의 항등행렬과 동일하다는 귀무 가설을 Bartlet's 구형 검정에 의거 1%의 유의수준으로 기각하게 됩니다. 이는 요인분석이 적절하다는 것을 의미합니다.(3단계) 주성분 분석석을 돌려줍니다.factor trunk weight length turn , pcf
돌리면서 옵션에 'p cf'라고 입력하셨죠? 이것은 주성분요인의 기법옵션입니다.결과를 보면 상부에서는 상관행렬의 고유치를 나타내면서 원시변수의 분산이 공유된 해당 비율을 나타내고 있고 하단에서는 각 변수와 고유치가 1보다 큰 요인 사이의 상관관계를 나타내는 요인을 나타내고 있습니다.Uniqueness 이게 뭘까요? 배타성이며 이를 계산하는 방식은 Uniqueness=(1-communality 2), 즉 1-0.8084의 제곱을 하고 trunk의 Uniqueness가 0.8084임이 확인됩니다. 보시면 weight, length가 상당히 높은 걸 보실 수 있습니다. 해당 분석에서는, 1개의 요인이 추출되고 있는 것을 알 수 있습니다(Factor1).
근데 기억나세요? 요인 적재가 나오면 회전이 나와야 하지 않겠습니까?(Part 1) 직교회전을 우리는 자주 합니다. 재분배~
rotate , varimax horst
horst는 표준화된 요인 적재로부터의 회전각을 정의하기 위해 적시합니다. 여기에서는 공유된 분산의 총 비율은 83.71%로 확인되었습니다. 그리고 factor1을 만들기 위해서는predict factor1을 실행하면 factor1이 생성됩니다.
그리고 사용하세요.~
제가 좀 길게 썼는데 굳이 이렇게 안 해도 돼요. 원시변수에 대해 Z점수 절차를 이용하여 표준화변수를 생성한 후 요인이 종속변수이고 표준화된 변수를 독립변수로 하여 진행할 수도 있습니다.
설명 중심이라 조금 길어졌지만
주성분인 요인 분석을 해당하는 포스팅을 보고 공부하면서 다양한 서적과 연구를 통해 공부하면
분명 좋은 연구 결과가 있을 거예요.^^
오늘 하루도 고생 많으셨고원하는 연구결과가 있기를 바랍니다.



