T-통계량

IT 위키

t-통계량(t-statistic)은 표본에서 계산된 통계량이 귀무가설(null hypothesis) 하에서 얼마나 극단적인지를 나타내는 지표로, 주로 모집단의 분산을 알 수 없을 때 사용된다. t-분포를 따르며, t-검정(t-test)에서 핵심적인 역할을 한다.

1 개념[편집 | 원본 편집]

t-통계량은 표본 평균과 귀무가설 하의 평균의 차이를 표준 오차로 나눈 값이다. 이는 관측된 표본 평균이 귀무가설에서 기대하는 평균과 얼마나 떨어져 있는지를 측정하는 수단이다.

2 일반적인 공식[편집 | 원본 편집]

단일 표본 t-검정(일표본 t-test)의 경우:

t = (x̄ - μ₀) / (s / √n)

  • x̄: 표본 평균
  • μ₀: 귀무가설에서의 평균
  • s: 표본 표준편차
  • n: 표본 크기

3 이표본 t-검정[편집 | 원본 편집]

두 독립된 집단의 평균을 비교할 때:

t = (x̄₁ - x̄₂) / √(s2p(1/n₁ + 1/n₂))

여기서 s2p는 두 표본의 풀링된(공통) 분산이다.

4 활용[편집 | 원본 편집]

  • 일표본 t검정: 모집단 평균과 표본 평균을 비교
  • 독립 이표본 t검정: 두 집단의 평균 비교
  • 대응표본 t검정: 짝을 이루는 두 값의 차이 평균 비교

5 해석[편집 | 원본 편집]

계산된 t-통계량이 클수록 (절댓값 기준) 귀무가설과의 차이가 크며, p값이 작아질 가능성이 높다. 이 값을 자유도에 맞는 t-분포와 비교하여 귀무가설 기각 여부를 판단한다.

예시:

  • x̄ = 98, μ₀ = 100, s = 4, n = 16

→ t = (98 - 100) / (4 / √16) = -2 / 1 = -2

df = 15일 때, t = -2에 대한 단측 p값 ≈ 0.03 → α = 0.05보다 작으면 기각 가능

6 특징[편집 | 원본 편집]

  • 표본 크기가 작을수록 분산이 불확실하므로 t-분포를 사용
  • 표본 수가 많아질수록 t-분포는 정규분포에 가까워짐
  • 정규성을 가정하나, 표본 크기가 충분히 크면 중심극한정리에 의해 비교적 안전하게 사용 가능

7 같이 보기[편집 | 원본 편집]

8 참고 문헌[편집 | 원본 편집]

  • Moore, D. S., McCabe, G. P., & Craig, B. A. (2012). Introduction to the Practice of Statistics. W. H. Freeman.
  • Wasserman, L. (2004). All of Statistics: A Concise Course in Statistical Inference. Springer.