평균으로의 회귀
평균으로의 회귀(regression toward the mean)는 통계학에서 관측값이 극단적인 값을 보일 경우, 다음 측정에서는 평균에 더 가까운 값으로 이동하는 경향이 있다는 현상을 말한다. 이 개념은 프랜시스 골턴(Francis Galton)에 의해 처음 정식화되었으며, 유전학 연구에서 부모의 키와 자식의 키 간의 관계를 분석하면서 등장했다.
1 개념[편집 | 원본 편집]
어떤 현상에서 무작위 요소(random factors)가 영향을 미칠 때, 극단적인 결과(extreme outcome)는 일시적인 요인에 의해 발생할 수 있다. 이 경우 다음 관측에서는 이러한 일시적인 요인이 사라지거나 감소하여 평균(mean)에 가까운 결과가 나타나는 경향이 있다.
예를 들어, 시험에서 매우 높은 점수를 받은 학생은 다음 시험에서는 평균에 가까운 점수를 받을 가능성이 있고, 매우 낮은 점수를 받은 학생도 다음 시험에서는 평균에 가까운 점수를 받을 가능성이 있다. 이는 학생의 실력이 변했다기보다는, 우연한 요인(운 등)의 영향이 줄어들었기 때문이다.
2 수학적 설명[편집 | 원본 편집]
평균으로의 회귀는 두 변수 X와 Y가 있을 때, 상관계수(correlation coefficient) r이 1보다 작을 경우 발생한다. Y의 값은 X에 따라 선형 회귀(linear regression)를 통해 예측할 수 있으며, 예측된 Y값은 단순히 X의 평균과 Y의 평균 사이의 선형 함수이다. 이 회귀선(regression line)은 완전한 1:1 기울기를 가지지 않으며, 따라서 X가 평균에서 벗어날수록 예측된 Y는 X보다는 평균에 더 가까운 값을 갖게 된다.
3 오해[편집 | 원본 편집]
평균으로의 회귀는 실제 변화(real change)가 발생한 것으로 오해되기 쉽다. 예를 들어, 운동선수가 어느 시즌에 비정상적으로 좋은 성적을 내고 다음 시즌에 평균적인 성적을 거두면, 많은 사람들이 "선수가 하락했다"고 해석할 수 있다. 그러나 이는 평균으로의 회귀 효과일 수 있으며, 선수의 실력이 실제로 하락한 것이 아닐 수 있다.
4 예시[편집 | 원본 편집]
- 키 유전(height inheritance): 키가 매우 큰 부모의 자녀는 부모보다는 작은 키를 가질 가능성이 높고, 키가 매우 작은 부모의 자녀는 더 큰 키를 가질 가능성이 높다.
- 스포츠 기록(sports performance): 특정 경기에서 매우 좋은 성적을 낸 선수는 다음 경기에서 평균적인 성적을 낼 가능성이 높다.
- 마케팅 실험(marketing experiment): 어떤 캠페인 결과가 매우 좋았더라도, 다음 실행 시에는 평균적인 결과로 돌아갈 수 있다.
5 평균으로의 회귀와 회귀분석[편집 | 원본 편집]
회귀분석(regression analysis)은 평균으로의 회귀 현상을 수학적으로 설명하는 도구로, 통계학 및 머신러닝에서 널리 사용된다. 평균으로의 회귀 개념은 단순 선형 회귀(simple linear regression)에서 자연스럽게 나타나는 현상 중 하나이다.
6 같이 보기[편집 | 원본 편집]
7 참고 문헌[편집 | 원본 편집]
- Galton, F. (1886). Regression towards mediocrity in hereditary stature. The Journal of the Anthropological Institute of Great Britain and Ireland, 15, 246–263.
- Freedman, D., Pisani, R., & Purves, R. (2007). Statistics (4th ed.). W. W. Norton & Company.