상관관계 분석
From IT Wiki
- Correlation
한 변수와 다른 변수가 함께 변하는 함수관계
방향성과 강도
- 방향성
- 양의 상관관계: X가 증가할 때 Y가 증가
- 음의 상관관계: X가 증가할 때 Y가 감소
- 강도
- 상관관계의 강하고 약하고의 정도
- 강한 상관관계일수록 공분산, 또는 상관계수의 크기가 큼
- 약한 상관관계일수록 공분산, 또는 상관계수의 크기가 작음
공분산과 상관계수
공분산
Covariance 2개의 변수 사이의 상관 정도로, 범위의 영향을 크게 받음
- COV(X,Y) = E(X-μx)(Y-μy)
- 양의 상관이면 공분산이 +로 점점 더 커짐
- 음의 상관이면 공분산이 -로 점점 더 작아짐
- 상관이 없으면 0에 가까움
- 범위의 영향이 적도록 표준화한 것이 상관계수
상관계수
Correlation Coefficient
- 일반적으로 -1 ~ +1까지의 범위로 나타남
- 표본 상관계수: 피어슨 상관계수
- 1인 경우: 완벽한 양의 상관관계
- -1인 경우: 완벽한 음의 상관관계
- 0인 경우: 상관관계가 없음
변수의 수
- 단순상관분석: 2개의 변수 간 상관관계 분석
- ex) 나이와 급여 사이의 상관관계 분석
- 다중상관분석: 3개 이상의 변수 간 상관간계 분석
- ex) 나이와 급여, 직위 사이의 상관관계 분석
- 편상관계분석: 다중상관분석에서 다른 변수와의 관계를 고정하고 나머지 두 변수 간 상관관계 분석
- ex) 나이와 급여가 양의 상관관계를 가질 때, 직위가 끼치는 영향 강도 분석
상관관계와 인과관계
상관관계는 단순히 변수간 선형 상관성을 의미할 뿐, 인과관계로 볼 수는 없다
- 인과관계: 원인과 결과의 관계
- ex) 저녁을 먹었기 때문에 배가 부르다
- 상관관계: 변수간의 선형 상관성
- ex) 저녁을 먹는 양에 따라 배 부른 정도가 증가한다.