산점도
IT 위키
산점도(scatter plot)는 두 변수 간의 관계를 시각적으로 표현하는 그래프이다. 데이터의 각 점은 두 변수의 값을 좌표평면 상의 하나의 점으로 나타낸다.
개요[편집 | 원본 편집]
산점도는 한 변수의 값을 x축에, 다른 변수의 값을 y축에 대응시켜, 데이터 포인트를 점(dot)으로 표시한다. 이를 통해 변수 간의 관계(상관성), 경향성, 분포 패턴, 이상치(outlier) 등을 직관적으로 파악할 수 있다.
구성 요소[편집 | 원본 편집]
- x축: 독립 변수(independent variable) 또는 설명 변수(explanatory variable)
- y축: 종속 변수(dependent variable) 또는 반응 변수(response variable)
- 데이터 점(dot): 각 관측값에 해당하는 좌표 (x, y)
특징[편집 | 원본 편집]
- 변수 간의 관계를 시각적으로 파악할 수 있다.
- 선형 관계(linear relationship), 비선형 관계(nonlinear relationship), 상관성의 유무를 직관적으로 확인할 수 있다.
- 이상치(outlier)나 데이터 그룹(cluster)도 식별할 수 있다.
- 상관계수(correlation coefficient)와 함께 분석하면 변수 간 관계를 수치적으로도 평가할 수 있다.
활용 예시[편집 | 원본 편집]
- 키와 몸무게 간의 관계 분석
- 공부 시간과 시험 점수 간의 관계 분석
- 투자 수익률과 리스크 간의 관계 시각화
- 생산 공정 변수 간의 품질 특성 관계 분석
산점도와 히스토그램의 차이[편집 | 원본 편집]
- 산점도: 두 변수 간의 관계를 나타낸다.
- 히스토그램: 하나의 변수 분포(빈도)를 나타낸다.
같이 보기[편집 | 원본 편집]
참고 문헌[편집 | 원본 편집]
- Freedman, D., Pisani, R., & Purves, R. (2007). Statistics (4th ed.). W. W. Norton & Company.
- Montgomery, D. C. (2012). Introduction to Statistical Quality Control (7th ed.). Wiley.