P-값

IT 위키

p-값(p-value)은 통계적 가설 검정에서 관찰된 결과가 귀무가설 하에서 우연히 발생할 확률을 나타내는 값이다. 이 값은 0과 1 사이의 확률로 표현되며, 검정 결과의 유의성을 판단하는 데 중요한 역할을 한다.

1 개요[편집 | 원본 편집]

p-값은 귀무가설(null hypothesis)이 참일 때, 관측된 데이터보다 극단적인 결과가 나타날 확률을 의미한다. 일반적으로 p-값이 작을수록 우연에 의한 결과일 가능성이 낮다고 보고, 미리 정한 유의수준(예, 0.05)보다 낮으면 귀무가설을 기각하게 된다.

2 정의[편집 | 원본 편집]

p-값은 다음과 같이 정의된다.

  • p-값 = 귀무가설이 참일 때, 관측된 통계량과 같거나 더 극단적인 결과가 나타날 확률

즉, p-값은 검정 통계량의 분포를 기준으로 계산되며, 데이터의 극단성을 수치적으로 표현한다.

3 특징[편집 | 원본 편집]

  • 값의 범위: 0과 1 사이의 값을 가지며, 0에 가까울수록 관측된 결과가 귀무가설 하에서 발생할 가능성이 낮음을 의미한다.
  • 유의수준과의 비교: 보통 0.05나 0.01과 같은 미리 설정된 유의수준과 비교하여 귀무가설의 기각 여부를 결정한다.
  • 확률적 의미: p-값은 귀무가설이 참이라는 전제 하에 결과가 나타날 확률을 의미하므로, p-값이 크다고 해서 귀무가설이 참임을 확정할 수는 없다.

4 해석[편집 | 원본 편집]

  • p-값 < 유의수준 (예: 0.05): 관측된 결과가 우연히 발생할 확률이 매우 낮으므로, 귀무가설을 기각하고 대립가설을 채택한다.
  • p-값 ≥ 유의수준: 관측된 결과가 귀무가설 하에서 우연히 발생할 가능성이 충분히 있으므로, 귀무가설을 기각할 증거가 부족하다.

5 활용[편집 | 원본 편집]

p-값은 t-검정, ANOVA, 회귀 분석 등 다양한 통계 검정에서 사용된다. 연구자들은 p-값을 통해 실험이나 조사 결과가 우연에 의한 것인지, 또는 통계적으로 유의미한 차이가 있는지를 판단하며, 이를 기반으로 의사결정을 내린다.

6 같이 보기[편집 | 원본 편집]

7 참고 문헌[편집 | 원본 편집]

  • Fisher, R. A. (1925). Statistical Methods for Research Workers.
  • Neyman, J., & Pearson, E. S. (1933). On the Problem of the Most Efficient Tests of Statistical Hypotheses.