통계적 가설 검정 p-값

IT 위키
AlanTuring (토론 | 기여)님의 2025년 3월 29일 (토) 08:30 판 (새 문서: p값(p-value)은 통계적 가설 검정에서 귀무가설(null hypothesis, H<sub>0</sub>)이 참이라는 전제 하에, 현재의 데이터와 같거나 더 극단적인 결과가 나올 확률을 의미한다. p값은 관측된 데이터가 귀무가설과 얼마나 일치하는지를 수치적으로 표현하는 지표이다. == 개념 == p값은 검정통계량(test statistic)이 특정 값보다 크거나 작을 확률을 계산하여 구한다. 이 확률이 미리 정...)
(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)

p값(p-value)은 통계적 가설 검정에서 귀무가설(null hypothesis, H0)이 참이라는 전제 하에, 현재의 데이터와 같거나 더 극단적인 결과가 나올 확률을 의미한다. p값은 관측된 데이터가 귀무가설과 얼마나 일치하는지를 수치적으로 표현하는 지표이다.

1 개념

p값은 검정통계량(test statistic)이 특정 값보다 크거나 작을 확률을 계산하여 구한다. 이 확률이 미리 정한 유의수준(significance level, α)보다 작으면, 귀무가설을 기각할 수 있다.

즉, p값이 작을수록 관측된 결과가 귀무가설 하에서 발생하기 어려운 것으로 간주되며, 이는 귀무가설이 맞지 않을 가능성이 높다는 의미로 해석된다.

2 해석

  • p값 ≤ α: 귀무가설을 기각할 수 있다 (통계적으로 유의미함)
  • p값 > α: 귀무가설을 기각할 수 없다 (통계적으로 유의미하지 않음)

예시:

  • p값 = 0.03, α = 0.05 → 기각
  • p값 = 0.08, α = 0.05 → 기각하지 않음

3 계산 예시

어떤 회사가 생산하는 부품의 평균 길이가 10cm인지 검정하려고 한다. 표본 9개를 측정했더니 다음과 같은 데이터가 나왔다:

8.9, 9.7, 10.2, 10.5, 9.8, 10.1, 9.6, 10.3, 10.0

  • 귀무가설: H0: μ = 10
  • 대립가설: H1: μ ≠ 10 (양측 검정)

표본 평균 x̄ = 9.9 표본 표준편차 s ≈ 0.25 표본 크기 n = 9

검정통계량은 다음과 같이 계산된다:

t = (x̄ - μ) / (s / √n) = (9.9 - 10) / (0.25 / √9) ≈ -1.2

자유도 df = n - 1 = 8일 때, t분포표를 참고하거나 계산기를 사용하면:

  • p값 ≈ 0.26 (양측 검정이므로, t = -1.2에 해당하는 양쪽 면적의 합)

이 p값은 일반적인 유의수준 0.05보다 크므로, 귀무가설을 기각할 수 없다. 즉, "표본 평균이 9.9였지만 이는 우연히 발생할 수 있는 수준이며, 평균이 10이라는 주장에 반박할 근거는 충분하지 않다"고 해석된다.

4 오해

  • p값은 귀무가설이 참일 확률이 아니다.
  • p값은 대립가설이 참일 확률도 아니다.
  • p값이 작다고 해서 효과의 크기(effect size)가 크다는 뜻은 아니다.

5 시각적 이해

p값은 보통 정규분포나 t분포 그래프에서 관측값보다 더 극단적인 영역의 면적으로 시각화된다. 양측 검정(two-tailed test)에서는 양 끝단의 면적 합이 p값이다.

6 같이 보기

7 참고 문헌

  • Wasserman, L. (2004). All of Statistics: A Concise Course in Statistical Inference. Springer.
  • Goodman, S. N. (2008). A dirty dozen: twelve p-value misconceptions. Seminars in Hematology, 45(3), 135–140.