로그 정규 분포
IT 위키
로그 정규 분포(로그 正規 分布, 영어: log-normal distribution)는 확률 변수의 로그가 정규 분포를 따르는 확률 분포이다. 즉, 확률 변수 X가 로그 정규 분포를 따른다는 것은 ln(X)가 정규 분포를 따른다는 것을 의미한다. 로그 정규 분포는 정수 값만을 가지는 데이터나, 0보다 큰 양수 데이터에 적합한 분포로 실무에서 널리 사용된다.
1 정의[편집 | 원본 편집]
확률 변수 X가 로그 정규 분포를 따른다고 할 때, Y = ln(X)는 정규 분포 N(μ, σ²)을 따른다. 이때 X는 로그 정규 분포라고 한다.
X ~ LogNormal(μ, σ²) ⇔ ln(X) ~ N(μ, σ²)
2 확률 밀도 함수[편집 | 원본 편집]
로그 정규 분포의 확률 밀도 함수는 다음과 같다.
f(x) = (1 / (xσ√(2π))) * exp(− (ln(x) − μ)² / (2σ²)), x > 0
3 특징[편집 | 원본 편집]
- 정의역은 (0, ∞)로, 음수 값은 불가능하다.
- 오른쪽으로 긴 꼬리를 가진 비대칭 분포이다 (positive skew).
- 평균, 중앙값, 최빈값이 서로 다르며 다음 관계를 가진다.
4 요약 통계[편집 | 원본 편집]
- 평균 (Expected value): exp(μ + σ² / 2)
- 중앙값 (Median): exp(μ)
- 분산 (Variance): [exp(σ²) − 1] * exp(2μ + σ²)
- 최빈값 (Mode): exp(μ − σ²)
5 사용 사례[편집 | 원본 편집]
- 금융: 자산 가격, 주가 수익률 분포
- 공학: 제품 수명, 결함 발생 간격
- 환경과학: 오염물질 농도, 입자 크기
- 경제학: 소득 분포, 비용 구조
6 정규 분포와의 관계[편집 | 원본 편집]
- 정규 분포는 실수 전체(−∞, ∞)를 정의역으로 하지만, 로그 정규 분포는 양수만을 다룬다.
- 로그 정규 분포는 정규 분포를 지수 변환한 결과이다.
- 로그 정규 분포의 분석에는 로그 스케일 변환을 적용하여 정규 분포 가정 하의 통계 기법을 활용할 수 있다.
7 시각화 예시[편집 | 원본 편집]
로그 정규 분포는 오른쪽 꼬리가 길고, 왼쪽은 0을 향해 빠르게 감소하는 모양을 가진다. 정규 분포와 달리 평균보다 중앙값이 작고, 최빈값은 더 작다.
8 같이 보기[편집 | 원본 편집]
9 참고 문헌[편집 | 원본 편집]
- Aitchison, J., & Brown, J. A. C. (1957). The Lognormal Distribution. Cambridge University Press.
- Papoulis, A., & Pillai, S. U. (2002). Probability, Random Variables and Stochastic Processes.
- 이영조. (2021). 통계학 입문. 자유아카데미.