기하 분포

IT 위키

기하분포(幾何分布, geometric distribution)는 확률론과 통계학에서 성공 확률이 일정한 베르누이 시행을 독립적으로 반복할 때, 최초의 성공이 나타나기까지 시행한 횟수를 확률 변수로 하는 이산 확률 분포이다.

1 정의[편집 | 원본 편집]

기하분포는 두 가지 방식으로 정의된다.

  • 형식 1 (시행 횟수 기준): 최초의 성공이 나오는 시행의 번호를 확률 변수로 하는 경우
  • 형식 2 (실패 횟수 기준): 최초의 성공이 나오기 전까지의 실패 횟수를 확률 변수로 하는 경우

이 문서에서는 일반적으로 형식 1의 정의를 따른다.

성공 확률이 p인 베르누이 시행에서 기하분포의 확률 질량 함수는 다음과 같다.

  • P(X = k) = (1 - p)^(k - 1) * p, k = 1, 2, 3, ...

2 성질[편집 | 원본 편집]

  • 기댓값: E(X) = 1 / p
  • 분산: Var(X) = (1 - p) / p²
  • 기억 없음 성질: P(X > s + t | X > s) = P(X > t)
  • 누적 분포 함수: F(k) = P(X ≤ k) = 1 - (1 - p)^k

3 예시[편집 | 원본 편집]

공정한 동전을 던질 때 앞면이 나올 확률이 0.5라고 하자. 동전을 계속 던지면서 처음으로 앞면이 나올 때까지 걸린 시행의 번호를 확률 변수 X라고 하면, 이 X는 기하분포를 따른다.

예를 들어, 첫 번째와 두 번째 던짐에서 뒷면이 나오고, 세 번째 던짐에서 처음으로 앞면이 나왔다고 하자. 이 경우 X = 3이며, 다음과 같은 확률로 계산된다.

  • P(X = 3) = (1 - 0.5)^(3 - 1) * 0.5 = (0.5)^2 * 0.5 = 0.125

이 예시는 "형식 1" 정의에 기반한 것으로, 시행 번호가 확률 변수임에 주의해야 한다. 반면 "형식 2"에서는 실패 횟수를 변수로 하며, 같은 상황에서 실패 횟수는 2가 된다.

4 다른 분포와의 관계[편집 | 원본 편집]

  • 베르누이 분포: 기하분포는 베르누이 시행의 반복을 통해 정의된다.
  • 음이항 분포: 기하분포는 성공 횟수가 1인 음이항 분포의 특수한 경우이다.
  • 지수분포: 기하분포는 지수분포의 이산적 대응이다.

5 활용[편집 | 원본 편집]

  • 품질 관리에서 불량품이 처음 나타날 때까지의 검사 횟수 모델링
  • 무선 통신에서 패킷 재전송 횟수 분석
  • 게임에서 특정 이벤트가 발생하기까지의 시도 횟수 예측

6 같이 보기[편집 | 원본 편집]

7 참고 문헌[편집 | 원본 편집]

  • Sheldon M. Ross, Introduction to Probability Models, Academic Press, 2014
  • William Feller, An Introduction to Probability Theory and Its Applications, Vol. 1, Wiley, 1968

8 각주[편집 | 원본 편집]