정상성

IT 위키
정상성이 있는 데이터와 없는 데이터

정상성(Stationarity)은 시계열 데이터의 평균(mean), 분산(variance), 자기상관(autocorrelation) 등 통계적 특성이 시간에 따라 일정하게 유지되는 성질을 의미한다. 이 개념은 경제, 금융, 기상 등 다양한 분야의 시계열 분석 및 예측 모형 구축에 필수적인 전제 조건으로 사용된다.

1 개요[편집 | 원본 편집]

정상성(Stationarity)은 시계열 데이터가 시간의 흐름에 따라 일정한 통계적 특성을 유지하는 상태를 말한다. 정상 시계열은 데이터의 평균, 분산, 그리고 자기상관 구조가 변하지 않으며, 이러한 성질 덕분에 과거 데이터를 기반으로 미래를 예측하는 데 안정적인 모형을 구성할 수 있다. 반면, 비정상 시계열(non-stationary series)은 추세(trend), 계절성(seasonality) 또는 구조적 변화 등으로 인해 이러한 특성이 일정하지 않아, 예측 모형에 바로 적용하기 어려우므로 전처리 과정을 통해 정상성을 확보해야 한다.

2 특징[편집 | 원본 편집]

  • 평균 일정성 (Constant Mean)
    • 데이터의 평균이 시간에 걸쳐 일정하게 유지된다. 이는 장기적으로 데이터가 특정 중심값 주위에서 진동함을 의미한다.
  • 분산 일정성 (Constant Variance)
    • 데이터의 분산이 일정하여, 시계열의 변동 폭이 일정한 범위 내에서 유지된다. 예측 오차의 분포가 안정적이라는 점에서 중요하다.
  • 자기상관 일정성 (Stationary Autocorrelation)
    • 시계열 내에서 특정 시점 간의 상관관계가 일정하게 유지되어, 시계열의 패턴이 시간에 따라 크게 변하지 않는다.
  • 계절성과 추세 제거 (Removal of Seasonality and Trend)
    • 정상 시계열은 데이터 내 존재하는 계절적 요인(seasonality)이나 추세(trend)와 같은 구조적 요인이 제거된 상태이다. 이를 위해 차분(differencing)이나 로그 변환 등의 전처리 기법이 사용된다.

3 활용[편집 | 원본 편집]

정상성은 시계열 예측과 통계적 모형 구축에 있어 매우 중요한 전제 조건이다.

  • 예측 모형 구축
    • ARIMA (AutoRegressive Integrated Moving Average) 및 VAR (Vector AutoRegression) 등과 같은 시계열 예측 모형은 정상성을 전제로 하여 설계된다.
  • 경제 및 금융 분석
    • GDP, 주가, 환율 등 다양한 경제 지표와 금융 데이터는 정상성을 확인한 후 모형에 적용된다. 비정상 시계열의 경우, 차분이나 계절 조정 등의 방법으로 정상화를 거친 후 분석이 이루어진다.
  • 통계적 검정
    • 디키-풀러 검정(Dickey-Fuller Test) 및 확장 디키-풀러 검정(ADF Test; Augmented Dickey-Fuller Test) 등을 통해 시계열 데이터의 정상성을 평가한다.
  • 기상 및 환경 데이터 분석
    • 온도, 강수량, 기압 등의 기상 데이터 역시 정상성을 확보한 후 장기 예측이나 기후 변화 분석에 활용된다.

4 같이 보기[편집 | 원본 편집]

5 참고 문헌[편집 | 원본 편집]

  • Hamilton, J. D. (1994). Time Series Analysis. Princeton University Press.
  • Enders, W. (2004). Applied Econometric Time Series. Wiley.
  • Dickey, D. A., & Fuller, W. A. (1979). Distribution of the Estimators for Autoregressive Time Series with a Unit Root. Journal of the American Statistical Association.