표준 편차
IT 위키
표준 편차(Standard Deviation)는 데이터의 분포가 평균을 중심으로 얼마나 퍼져 있는지를 나타내는 통계적 지표이다. 표준 편차가 크면 데이터가 평균에서 멀리 퍼져 있고, 작으면 평균에 가까이 모여 있다.
1 정의[편집 | 원본 편집]
표준 편차는 분산(Variance)의 제곱근으로 정의된다.
- 모집단 표준 편차(σ)
- σ = sqrt( (1/N) * Σ (X_i - μ)² )
- 표본 표준 편차(s)
- s = sqrt( (1/(n-1)) * Σ (X_i - x̄)² )
여기서,
- X_i : 데이터의 각 값
- μ : 모집단의 평균
- x̄ : 표본의 평균
- N : 모집단 크기
- n : 표본 크기
- Σ : 합(sum) 연산
- sqrt : 제곱근 연산
2 표준 편차 계산 예제[편집 | 원본 편집]
다음 데이터 {2, 4, 6, 8, 10}의 표준 편차를 계산한다.
- 평균(μ) = (2 + 4 + 6 + 8 + 10) / 5 = 6
- 각 값의 편차 = (-4, -2, 0, 2, 4)
- 제곱한 값 = (16, 4, 0, 4, 16)
- 분산(σ²) = (16 + 4 + 0 + 4 + 16) / 5 = 8
- 표준 편차(σ) = sqrt(8) ≈ 2.83
3 표준 편차의 특징[편집 | 원본 편집]
- 항상 0 이상이다.
- 단위가 원래 데이터와 동일하다.
- 데이터의 변동성이 크면 표준 편차도 커진다.
- 평균이 달라도 분포의 퍼짐 정도는 표준 편차가 나타낸다.
4 표준 편차와 변동 계수[편집 | 원본 편집]
표준 편차는 데이터의 절대적인 변동성을 측정하지만, 변동 계수(Coefficient of Variation, CV)는 상대적인 변동성을 측정한다.
- 변동 계수(CV) = (표준 편차 / 평균) × 100%
변동 계수는 평균이 다른 두 데이터 집합을 비교할 때 유용하다.
5 표준 편차와 분산의 차이[편집 | 원본 편집]
표준 편차와 분산은 모두 데이터의 변동성을 측정하지만, 다음과 같은 차이가 있다.
구분 | 표준 편차 | 분산 |
---|---|---|
정의 | 데이터의 평균으로부터의 평균적인 거리를 나타냄 | 편차 제곱의 평균으로 변동성의 크기를 측정 |
수식 | σ = sqrt( (1/N) * Σ (X_i - μ)² ) | σ² = (1/N) * Σ (X_i - μ)² |
단위 | 원래 데이터와 동일 | 원래 데이터의 제곱 단위 |
해석 | 데이터가 평균을 중심으로 얼마나 퍼져 있는지를 직관적으로 보여줌 | 변동성의 정도를 수학적으로 분석하는 데 유용 |
사용 용도 | 데이터의 실제 분포를 직관적으로 해석하는 데 사용 | 통계 모델에서 분산 분석(ANOVA) 및 확률 계산 등에 사용 |
6 같이 보기[편집 | 원본 편집]
7 참고 문헌[편집 | 원본 편집]
- Montgomery, D. C., & Runger, G. C. (2014). Applied Statistics and Probability for Engineers.