안녕하세요 ^^ Ph.DRyu입니다 오늘은 주성분 분석 두 번째 이야기를 할 건데요. (요인분석이 시간이 이렇게 많이 걸릴줄은 몰랐네요...;;;) 일단 시작했으니까 끝까지 내주세요. 시작하겠습니다! sysuse auto, clear로 시작해보겠습니다! …(1단계) 상관 분석 주성분요인 분석 전 확인합니다.피어슨의 상관계수를 한번 확인하는 것이 좋습니다.사람 분석이 상관계수, 상관계렬을 이용하기 때문인데 요인 분석 전에 요인 분석하는 변수 간의 상관계수를 파악해 주세요. 요인분석을 하기 위해서는 원시변수에서 적절한 요인을 찾기 위해 상관계수(Rho)가 상대적으로 높고 유의해야 합니다.여기서 상대적으로 높아야 한다고 했는데, 이 기준은 Hair et al. (2009) 연구에 의해서 0.3을 기준으로 한다고 하네요. 저는 4가지 변수의 요인 분석을 하겠습니다. 그래서 다음과 같이 상관계수로 살펴보았습니다.(상관계수뿐만 아니라 p-value에 의한 상관계수를 참조하십시오.) pwcorr trunk weight length turn , sig star ( 0 . 01 ) 1% 정도로 별을 띄워서 상관계수를 먼저 확인해 보세요보시면 중량변수와 길이변수는 거의 모든 변수와 강한 상관관계를 확인하실 수가 있죠.(2단계) 요인추출의 적절성검정(KMO: Kaiser-Meyer-Olkin, Bartlet's test of sphericity) KMO검정은? Part 1 에서 이야기를 했지만, 재차 말하면, "표본의 모든 변수에"공통"으로 간주되는"분산의 비율"을 확인하는 방법이다. 해당 검정을 통해 공통요인의 존재 여부를 판단할 수 있습니다.' 해석은?해당하는검정통계량은0에서1사이의검정통계치가산출됩니다. 1에 가까울수록 변수가 높은 분산비율을 공유하고 있다는 뜻입니다. 하단의 실증분석 결과를 볼까요? 밑에 0.810 나오는 게 보여요 적절성이 높게 나타났습니다. (part1에 적절성 정도의 이야기가 있습니다.) fa...