통계적 가설 검정 p-값

p값(p-value)은 통계적 가설 검정에서 귀무가설(null hypothesis, H₀)이 참이라는 전제 하에, 현재의 데이터와 같거나 더 극단적인 결과가 나올 확률을 의미한다. p값은 관측된 데이터가 귀무가설과 얼마나 일치하는지를 수치적으로 표현하는 지표이다.

1 개념

p값은 검정통계량(test statistic)이 특정 값보다 크거나 작을 확률을 계산하여 구한다. 이 확률이 미리 정한 유의수준(significance level, α)보다 작으면, 귀무가설을 기각할 수 있다.

즉, p값이 작을수록 관측된 결과가 귀무가설 하에서 발생하기 어려운 것으로 간주되며, 이는 귀무가설이 맞지 않을 가능성이 높다는 의미로 해석된다.

2 해석

p값 ≤ α: 귀무가설을 기각할 수 있다 (통계적으로 유의미함)
p값 > α: 귀무가설을 기각할 수 없다 (통계적으로 유의미하지 않음)

예시:

p값 = 0.03, α = 0.05 → 기각
p값 = 0.08, α = 0.05 → 기각하지 않음

3 계산 예시

어떤 회사가 생산하는 부품의 평균 길이가 10cm인지 검정하려고 한다. 표본 9개를 측정했더니 다음과 같은 데이터가 나왔다:

8.9, 9.7, 10.2, 10.5, 9.8, 10.1, 9.6, 10.3, 10.0

귀무가설: H₀: μ = 10
대립가설: H₁: μ ≠ 10 (양측 검정)

표본 평균 x̄ = 9.9 표본 표준편차 s ≈ 0.25 표본 크기 n = 9

검정통계량은 다음과 같이 계산된다:

t = (x̄ - μ) / (s / √n) = (9.9 - 10) / (0.25 / √9) ≈ -1.2

자유도 df = n - 1 = 8일 때, t분포표를 참고하거나 계산기를 사용하면:

p값 ≈ 0.26 (양측 검정이므로, t = -1.2에 해당하는 양쪽 면적의 합)

이 p값은 일반적인 유의수준 0.05보다 크므로, 귀무가설을 기각할 수 없다. 즉, "표본 평균이 9.9였지만 이는 우연히 발생할 수 있는 수준이며, 평균이 10이라는 주장에 반박할 근거는 충분하지 않다"고 해석된다.

4 오해

p값은 귀무가설이 참일 확률이 아니다.
p값은 대립가설이 참일 확률도 아니다.
p값이 작다고 해서 효과의 크기(effect size)가 크다는 뜻은 아니다.

5 시각적 이해

p값은 보통 정규분포나 t분포 그래프에서 관측값보다 더 극단적인 영역의 면적으로 시각화된다. 양측 검정(two-tailed test)에서는 양 끝단의 면적 합이 p값이다.

6 같이 보기

7 참고 문헌

Wasserman, L. (2004). All of Statistics: A Concise Course in Statistical Inference. Springer.
Goodman, S. N. (2008). A dirty dozen: twelve p-value misconceptions. Seminars in Hematology, 45(3), 135–140.

익명 사용자

검색

통계적 가설 검정 p-값

이름공간

더 보기

문서 행위

목차

1 개념

2 해석

3 계산 예시

4 오해

5 시각적 이해

6 같이 보기

7 참고 문헌

둘러보기

둘러보기

광고

위키 도구

위키 도구

익명 사용자

검색

통계적 가설 검정 p-값

1 개념

2 해석

3 계산 예시

4 오해

5 시각적 이해

6 같이 보기

7 참고 문헌

둘러보기

위키 도구

문서 도구