산점도

IT 위키

산점도(scatter plot)는 두 변수 간의 관계를 시각적으로 표현하는 그래프이다. 데이터의 각 점은 두 변수의 값을 좌표평면 상의 하나의 점으로 나타낸다.

개요[편집 | 원본 편집]

산점도는 한 변수의 값을 x축에, 다른 변수의 값을 y축에 대응시켜, 데이터 포인트를 점(dot)으로 표시한다. 이를 통해 변수 간의 관계(상관성), 경향성, 분포 패턴, 이상치(outlier) 등을 직관적으로 파악할 수 있다.

구성 요소[편집 | 원본 편집]

  • x축: 독립 변수(independent variable) 또는 설명 변수(explanatory variable)
  • y축: 종속 변수(dependent variable) 또는 반응 변수(response variable)
  • 데이터 점(dot): 각 관측값에 해당하는 좌표 (x, y)

특징[편집 | 원본 편집]

  • 변수 간의 관계를 시각적으로 파악할 수 있다.
  • 선형 관계(linear relationship), 비선형 관계(nonlinear relationship), 상관성의 유무를 직관적으로 확인할 수 있다.
  • 이상치(outlier)나 데이터 그룹(cluster)도 식별할 수 있다.
  • 상관계수(correlation coefficient)와 함께 분석하면 변수 간 관계를 수치적으로도 평가할 수 있다.

활용 예시[편집 | 원본 편집]

  • 키와 몸무게 간의 관계 분석
  • 공부 시간과 시험 점수 간의 관계 분석
  • 투자 수익률과 리스크 간의 관계 시각화
  • 생산 공정 변수 간의 품질 특성 관계 분석

산점도와 히스토그램의 차이[편집 | 원본 편집]

  • 산점도: 두 변수 간의 관계를 나타낸다.
  • 히스토그램: 하나의 변수 분포(빈도)를 나타낸다.

같이 보기[편집 | 원본 편집]

참고 문헌[편집 | 원본 편집]

  • Freedman, D., Pisani, R., & Purves, R. (2007). Statistics (4th ed.). W. W. Norton & Company.
  • Montgomery, D. C. (2012). Introduction to Statistical Quality Control (7th ed.). Wiley.

각주[편집 | 원본 편집]