익명 사용자
로그인하지 않음
토론
기여
계정 만들기
로그인
IT 위키
검색
잔차
편집하기
IT 위키
이름공간
문서
토론
더 보기
더 보기
문서 행위
읽기
편집
원본 편집
역사
경고:
로그인하지 않았습니다. 편집을 하면 IP 주소가 공개되게 됩니다.
로그인
하거나
계정을 생성하면
편집자가 사용자 이름으로 기록되고, 다른 장점도 있습니다.
스팸 방지 검사입니다. 이것을 입력하지
마세요
!
잔차(residual)는 통계학에서 관측값과 예측값 사이의 차이를 의미한다. 회귀분석(regression analysis)에서 잔차는 각 관측치가 회귀직선에서 얼마나 떨어져 있는지를 나타내며, 모델의 예측오차를 측정하는 데 사용된다. ==개념== 선형 회귀모형에서는 다음과 같은 식이 기본이 된다: Y<sub>i</sub> = Ŷ<sub>i</sub> + e<sub>i</sub> *Y<sub>i</sub>: 실제 관측값 *Ŷ<sub>i</sub>: 예측값 (회귀식에 의해 추정된 값) *e<sub>i</sub>: 잔차 = Y<sub>i</sub> − Ŷ<sub>i</sub> 잔차는 관측된 데이터가 모델에 의해 얼마나 잘 설명되는지를 보여주며, 잔차가 작을수록 모델의 설명력이 높다고 해석할 수 있다. ==특징== *잔차들의 평균은 항상 0이다: Σe<sub>i</sub> = 0 *회귀선은 잔차의 제곱합(SSE: Sum of Squared Errors)을 최소화하는 방향으로 결정된다 → 최소제곱법(OLS: Ordinary Least Squares) *잔차는 관측값에서 나온 실제 오차이므로, 오차항(error term)과 구분된다. 오차항은 모델에서 가정된 이론적인 오차이고, 잔차는 그 추정값이다. ==시각적 이해== 산점도 위에 회귀선을 그렸을 때, 각 점과 회귀선 사이의 수직 거리들이 잔차다. 잔차를 그래프로 나타낸 '''잔차 플롯(residual plot)'''은 모델이 잘 맞는지, 비선형성, 이분산성, 이상치 등을 파악하는 데 유용하다. ==활용== *모델 적합도 평가: 잔차가 작을수록 모델이 데이터를 잘 설명한다고 본다 *가정 진단: 잔차가 정규분포를 따르고 등분산성을 갖는지 검토함 *이상치 탐지: 잔차가 매우 큰 관측값은 이상치일 수 있다 ==잔차 제곱합 (SSE)== SSE = Σ(Y<sub>i</sub> − Ŷ<sub>i</sub>)² = Σe<sub>i</sub>² SSE는 전체 오차의 크기를 나타내며, 이를 줄이는 방향으로 회귀계수가 결정된다. ==같이 보기== *[[회귀 분석]] *[[최소제곱법]] *[[오차항]] *[[잔차 플롯]] *[[정규성 가정]] *[[이상치]] ==참고 문헌== *Montgomery, D. C., Peck, E. A., & Vining, G. G. (2012). ''Introduction to Linear Regression Analysis''. Wiley. *Weisberg, S. (2005). ''Applied Linear Regression'' (3rd ed.). Wiley. [[분류:통계학]]
요약:
IT 위키에서의 모든 기여는 크리에이티브 커먼즈 저작자표시-비영리-동일조건변경허락 라이선스로 배포된다는 점을 유의해 주세요(자세한 내용에 대해서는
IT 위키:저작권
문서를 읽어주세요). 만약 여기에 동의하지 않는다면 문서를 저장하지 말아 주세요.
또한, 직접 작성했거나 퍼블릭 도메인과 같은 자유 문서에서 가져왔다는 것을 보증해야 합니다.
저작권이 있는 내용을 허가 없이 저장하지 마세요!
취소
편집 도움말
(새 창에서 열림)
둘러보기
둘러보기
대문
최근 바뀜
광고
위키 도구
위키 도구
특수 문서 목록
문서 도구
문서 도구
사용자 문서 도구
더 보기
여기를 가리키는 문서
가리키는 글의 최근 바뀜
문서 정보
문서 기록