T-통계량
IT 위키
t-통계량(t-statistic)은 표본에서 계산된 통계량이 귀무가설(null hypothesis) 하에서 얼마나 극단적인지를 나타내는 지표로, 주로 모집단의 분산을 알 수 없을 때 사용된다. t-분포를 따르며, t-검정(t-test)에서 핵심적인 역할을 한다.
1 개념[편집 | 원본 편집]
t-통계량은 표본 평균과 귀무가설 하의 평균의 차이를 표준 오차로 나눈 값이다. 이는 관측된 표본 평균이 귀무가설에서 기대하는 평균과 얼마나 떨어져 있는지를 측정하는 수단이다.
2 일반적인 공식[편집 | 원본 편집]
단일 표본 t-검정(일표본 t-test)의 경우:
t = (x̄ - μ₀) / (s / √n)
- x̄: 표본 평균
- μ₀: 귀무가설에서의 평균
- s: 표본 표준편차
- n: 표본 크기
3 이표본 t-검정[편집 | 원본 편집]
두 독립된 집단의 평균을 비교할 때:
t = (x̄₁ - x̄₂) / √(s2p(1/n₁ + 1/n₂))
여기서 s2p는 두 표본의 풀링된(공통) 분산이다.
4 활용[편집 | 원본 편집]
- 일표본 t검정: 모집단 평균과 표본 평균을 비교
- 독립 이표본 t검정: 두 집단의 평균 비교
- 대응표본 t검정: 짝을 이루는 두 값의 차이 평균 비교
5 해석[편집 | 원본 편집]
계산된 t-통계량이 클수록 (절댓값 기준) 귀무가설과의 차이가 크며, p값이 작아질 가능성이 높다. 이 값을 자유도에 맞는 t-분포와 비교하여 귀무가설 기각 여부를 판단한다.
예시:
- x̄ = 98, μ₀ = 100, s = 4, n = 16
→ t = (98 - 100) / (4 / √16) = -2 / 1 = -2
df = 15일 때, t = -2에 대한 단측 p값 ≈ 0.03 → α = 0.05보다 작으면 기각 가능
6 특징[편집 | 원본 편집]
- 표본 크기가 작을수록 분산이 불확실하므로 t-분포를 사용
- 표본 수가 많아질수록 t-분포는 정규분포에 가까워짐
- 정규성을 가정하나, 표본 크기가 충분히 크면 중심극한정리에 의해 비교적 안전하게 사용 가능
7 같이 보기[편집 | 원본 편집]
8 참고 문헌[편집 | 원본 편집]
- Moore, D. S., McCabe, G. P., & Craig, B. A. (2012). Introduction to the Practice of Statistics. W. H. Freeman.
- Wasserman, L. (2004). All of Statistics: A Concise Course in Statistical Inference. Springer.