통계적 가설 검정: Difference between revisions
From IT Wiki
No edit summary |
|||
Line 1: | Line 1: | ||
[[분류:데이터 과학]][[분류:기술사 기출]] | [[분류:데이터 과학]][[분류:기술사 기출]] | ||
;Statistical Hypothesis Test | ;Statistical Hypothesis Test | ||
;모집단의 특성에 대한 통계적 가설을 모집단으로 부터 추출한 표본을 사용하여 검토하는 통계적인 추론 과정 | ;표본에서 얻은 사실을 근거로 하여 모집단에 대한 가설이 맞는지 통계적으로 검정하는 분석 방법 | ||
* 모집단의 특성에 대한 통계적 가설을 모집단으로 부터 추출한 표본을 사용하여 검토하는 통계적인 추론 과정 | |||
* 증명된 바 없는 주장이나 가설을 표본 통계량에 입각하여 주장이나 가설의 진위 여부를 판단, 증명, 검정하는 통계적 추론 방식 | |||
* 통계적인 유의성을 검정하는 것으로, 유의성 검정(Significance Test)이라고도 함 | * 통계적인 유의성을 검정하는 것으로, 유의성 검정(Significance Test)이라고도 함 | ||
== 구성 == | |||
* '''귀무가설(Null Hypothesis)''': 직접 검정 대상이 되는 가설 | |||
** 증명된 바 없는 주장이나 가설로, 우선은 이 귀무가설이 옳다고 가정 | |||
** 귀무가설은 기각(reject)이 목표 | |||
** 일반적으로 '''H<sub>0</sub>'''로 표기 | |||
* '''대립가설(Alternative Hypothesis)''': 귀무가설에 대립되는 가설 | |||
** 새로운 주장 또는 실제로 입증하고 싶은 가설 | |||
** 대립가설은 채택(accept)이 목표 | |||
** 일반적으로 '''H<sub>1</sub>'''로 표기 | |||
* '''임계값(Critical Value)''' | |||
** 주어진 유의수준에서 귀무가설의 채택과 기각에 관련된 의사결정 기준값 | |||
* '''유의 수준(Level of Significance)''' | |||
** 귀무가설이 실제 옳음에도 기각할 오류의 수준(위험 부담) | |||
** 일반적으로 '''α'''로 표기 | |||
** 0.05 라는 값을 가장 흔하게 사용 | |||
== 절차 == | |||
* 1. 가설 설정 | |||
* 2. 유의수준 결정 | |||
* 3. 통계 분석 | |||
* 4. 임계값과 유의수준 비교 | |||
* 5. 기각 또는 채택 | |||
== 예시 == | |||
* '''상황''' | |||
** 어떤 회사의 계약직의 지난해 평균 월급은 150만 원, 표준편차는 12만 원이었다고 한다. | |||
* '''가설 설정''' | |||
** 올해는 그보다 높을 것이라고 생각하여 표본 조사를 실시하기로 하였다. | |||
** 귀무가설(H<sub>0</sub>) : 평균 월급 = 150만 원 | |||
** 대립가설(H<sub>1</sub>) : 평균 월급 > 150만 원 | |||
* '''유의수준 설정''' | |||
** 유의수준은 α = 0.05 로 설정하였다. | |||
* '''통계 분석''' | |||
** 임의로 계약직 사원 100명을 뽑아 평균 월급을 조사하였다. | |||
** 100명에 대한 조사 결과는 155만 원이었다. | |||
* '''임계값과 유의수준 비교''' | |||
** [[표준정규분포표]]를 이용하여 95%(1 - 0.05)에 해당하는 z값 1.645 를 이용 | |||
** 1.645 = (임계값 - 150) / 1.2 | |||
** 임계값 = 151.974 | |||
** 155만 원 > 151.974만 원 | |||
* '''기각 또는 채택''' | |||
** 귀무가설 기각, 대립가설 채택 | |||
== 두 가지 오류 == | |||
* 제1종 오류: 귀무가설이 참임에도 이를 기각하는 오류 | |||
* 제2종 오류: 귀무가설이 거짓임에도 이를 채택하는 오류 | |||
== 기술사 기출 == | == 기술사 기출 == | ||
Line 9: | Line 58: | ||
== 같이 보기 == | == 같이 보기 == | ||
* [[1종 오류]] | * [[1종 오류]] | ||
* [[2종 오류]] | * [[2종 오류]] |
Revision as of 23:46, 9 May 2020
- Statistical Hypothesis Test
- 표본에서 얻은 사실을 근거로 하여 모집단에 대한 가설이 맞는지 통계적으로 검정하는 분석 방법
- 모집단의 특성에 대한 통계적 가설을 모집단으로 부터 추출한 표본을 사용하여 검토하는 통계적인 추론 과정
- 증명된 바 없는 주장이나 가설을 표본 통계량에 입각하여 주장이나 가설의 진위 여부를 판단, 증명, 검정하는 통계적 추론 방식
- 통계적인 유의성을 검정하는 것으로, 유의성 검정(Significance Test)이라고도 함
구성
- 귀무가설(Null Hypothesis): 직접 검정 대상이 되는 가설
- 증명된 바 없는 주장이나 가설로, 우선은 이 귀무가설이 옳다고 가정
- 귀무가설은 기각(reject)이 목표
- 일반적으로 H0로 표기
- 대립가설(Alternative Hypothesis): 귀무가설에 대립되는 가설
- 새로운 주장 또는 실제로 입증하고 싶은 가설
- 대립가설은 채택(accept)이 목표
- 일반적으로 H1로 표기
- 임계값(Critical Value)
- 주어진 유의수준에서 귀무가설의 채택과 기각에 관련된 의사결정 기준값
- 유의 수준(Level of Significance)
- 귀무가설이 실제 옳음에도 기각할 오류의 수준(위험 부담)
- 일반적으로 α로 표기
- 0.05 라는 값을 가장 흔하게 사용
절차
- 1. 가설 설정
- 2. 유의수준 결정
- 3. 통계 분석
- 4. 임계값과 유의수준 비교
- 5. 기각 또는 채택
예시
- 상황
- 어떤 회사의 계약직의 지난해 평균 월급은 150만 원, 표준편차는 12만 원이었다고 한다.
- 가설 설정
- 올해는 그보다 높을 것이라고 생각하여 표본 조사를 실시하기로 하였다.
- 귀무가설(H0) : 평균 월급 = 150만 원
- 대립가설(H1) : 평균 월급 > 150만 원
- 유의수준 설정
- 유의수준은 α = 0.05 로 설정하였다.
- 통계 분석
- 임의로 계약직 사원 100명을 뽑아 평균 월급을 조사하였다.
- 100명에 대한 조사 결과는 155만 원이었다.
- 임계값과 유의수준 비교
- 표준정규분포표를 이용하여 95%(1 - 0.05)에 해당하는 z값 1.645 를 이용
- 1.645 = (임계값 - 150) / 1.2
- 임계값 = 151.974
- 155만 원 > 151.974만 원
- 기각 또는 채택
- 귀무가설 기각, 대립가설 채택
두 가지 오류
- 제1종 오류: 귀무가설이 참임에도 이를 기각하는 오류
- 제2종 오류: 귀무가설이 거짓임에도 이를 채택하는 오류
기술사 기출
- 정보관리기술사 111회 1교시
- 정보관리기술사 121회 1교시
같이 보기
참고 문헌
- 정보관리기술사 121회 기출풀이 자료(아이리포 왕멘토)