평균 제곱근 오차

IT 위키
빅데이터분석기사 (토론 | 기여)님의 2025년 4월 9일 (수) 09:34 판 (새 문서: 평균 제곱근 오차(RMSE, Root Mean Squared Error)는 회귀 분석에서 예측값과 실제값 간의 차이를 측정하는 대표적인 평가 지표이다. 오차(Residual)의 제곱 평균에 루트를 씌운 값으로, 단위가 원래 데이터와 동일하여 해석이 직관적이다. ==정의== 평균 제곱근 오차는 다음 수식으로 정의된다. RMSE = sqrt( (1/n) * Σ (y<sub>i</sub> - ŷ<sub>i</sub>)² ) 여기서, *<big>y<sub>i</sub>: 실제값</big>...)
(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)

평균 제곱근 오차(RMSE, Root Mean Squared Error)는 회귀 분석에서 예측값과 실제값 간의 차이를 측정하는 대표적인 평가 지표이다. 오차(Residual)의 제곱 평균에 루트를 씌운 값으로, 단위가 원래 데이터와 동일하여 해석이 직관적이다.

정의

평균 제곱근 오차는 다음 수식으로 정의된다.

RMSE = sqrt( (1/n) * Σ (yi - ŷi)² )

여기서,

  • yi: 실제값
  • ŷi: 예측값
  • n: 샘플 수

특징

  • 오차가 클수록 RMSE 값도 커지며, 큰 오차에 더 민감하게 반응한다.
  • RMSE는 항상 0 이상의 값을 가지며, 0이면 완벽한 예측을 의미한다.
  • 단위가 원래 데이터와 같아 해석이 용이하다.

예시

실제값과 예측값이 다음과 같다고 하자.

  • 실제값: [3, 5, 2.5, 7]
  • 예측값: [2.5, 5, 4, 8]

오차 제곱합 = (3−2.5)² + (5−5)² + (2.5−4)² + (7−8)² = 0.25 + 0 + 2.25 + 1 = 3.5 RMSE = sqrt(3.5 / 4) ≈ 0.935

장점

  • 예측값과 실제값의 차이를 직관적으로 표현 가능
  • 단위가 원래 데이터와 같아 성능 해석에 유리함
  • 다른 모델과의 비교가 용이함

단점

  • 이상치에 민감함 (오차를 제곱하기 때문)
  • 각 샘플의 중요도가 동일하다고 가정

활용

  • 회귀 문제의 성능 평가 지표
  • 머신 러닝, 통계 모델, 시계열 분석 등에서 예측 정확도 측정
  • 하이퍼파라미터 튜닝의 목적 함수로 사용 가능

같이 보기

참고 문헌

  • Géron, A. (2019). Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow. O'Reilly Media.
  • Hyndman, R. J., & Athanasopoulos, G. (2018). Forecasting: Principles and Practice.