산점도: 두 판 사이의 차이

IT 위키
(새 문서: 산점도(scatter plot)는 두 변수 간의 관계를 시각적으로 표현하는 그래프이다. 데이터의 각 점은 두 변수의 값을 좌표평면 상의 하나의 점으로 나타낸다. ==개요== 산점도는 한 변수의 값을 x축에, 다른 변수의 값을 y축에 대응시켜, 데이터 포인트를 점(dot)으로 표시한다. 이를 통해 변수 간의 관계(상관성), 경향성, 분포 패턴, 이상치(outlier) 등을 직관적으로 파악할 수...)
 
(차이 없음)

2025년 4월 28일 (월) 00:53 기준 최신판

산점도(scatter plot)는 두 변수 간의 관계를 시각적으로 표현하는 그래프이다. 데이터의 각 점은 두 변수의 값을 좌표평면 상의 하나의 점으로 나타낸다.

개요[편집 | 원본 편집]

산점도는 한 변수의 값을 x축에, 다른 변수의 값을 y축에 대응시켜, 데이터 포인트를 점(dot)으로 표시한다. 이를 통해 변수 간의 관계(상관성), 경향성, 분포 패턴, 이상치(outlier) 등을 직관적으로 파악할 수 있다.

구성 요소[편집 | 원본 편집]

  • x축: 독립 변수(independent variable) 또는 설명 변수(explanatory variable)
  • y축: 종속 변수(dependent variable) 또는 반응 변수(response variable)
  • 데이터 점(dot): 각 관측값에 해당하는 좌표 (x, y)

특징[편집 | 원본 편집]

  • 변수 간의 관계를 시각적으로 파악할 수 있다.
  • 선형 관계(linear relationship), 비선형 관계(nonlinear relationship), 상관성의 유무를 직관적으로 확인할 수 있다.
  • 이상치(outlier)나 데이터 그룹(cluster)도 식별할 수 있다.
  • 상관계수(correlation coefficient)와 함께 분석하면 변수 간 관계를 수치적으로도 평가할 수 있다.

활용 예시[편집 | 원본 편집]

  • 키와 몸무게 간의 관계 분석
  • 공부 시간과 시험 점수 간의 관계 분석
  • 투자 수익률과 리스크 간의 관계 시각화
  • 생산 공정 변수 간의 품질 특성 관계 분석

산점도와 히스토그램의 차이[편집 | 원본 편집]

  • 산점도: 두 변수 간의 관계를 나타낸다.
  • 히스토그램: 하나의 변수 분포(빈도)를 나타낸다.

같이 보기[편집 | 원본 편집]

참고 문헌[편집 | 원본 편집]

  • Freedman, D., Pisani, R., & Purves, R. (2007). Statistics (4th ed.). W. W. Norton & Company.
  • Montgomery, D. C. (2012). Introduction to Statistical Quality Control (7th ed.). Wiley.

각주[편집 | 원본 편집]