선형 회귀: Difference between revisions

From IT Wiki
No edit summary
Line 12: Line 12:


== [[선형 회귀의 기본가정|선형 회귀의 4가지 기본가정]] ==
== [[선형 회귀의 기본가정|선형 회귀의 4가지 기본가정]] ==
* 선형성(Linearity): 독립변수(X)과 종속변수(Y)가 선형 관계에 있음
줄여서 LINE이라고 외우기도 하지만 한국의 기술사 학원 등에서 만들어낸 것으로 보인다. 전 세계적으론 [[CRUD]], [[트랜잭션 특성|ACID]], [[보안의 3요소|CIA]], [[객체지향 설계 원칙|SOLID]] 처럼 통용되진 않는다.
* 독립성(Independence): 종속변수는 다른 종속변수의 값에 의해 영향을 받지 않음
* 선형성('''L'''inearity): 독립변수(X)과 종속변수(Y)가 선형 관계에 있음
* 정규성(Normality): 오차항은 다변량 정규분포를 띔
* 독립성('''I'''ndependence): 종속변수는 다른 종속변수의 값에 의해 영향을 받지 않음
* 등분산성(Equal Variance): 오차항의 분산은 모든 종속변수에 대해 동일함
* 정규성('''N'''ormality): 오차항은 다변량 정규분포를 띔
* 등분산성(Homoscedasticity): 오차항의 분산은 모든 종속변수에 대해 동일함
** '''E'''qual Variance 라고도 불리지만 주로 한국에서 외우기 쉽게 번역한 것이고, 학술적으로 정확하진 않다.


== [[기계 학습]] ==
== [[기계 학습]] ==

Revision as of 05:31, 2 November 2024

Linear Regression
종속변수 y와 독립변수 x와의 선형 상관 관계를 모델링하는 회귀 분석 기법

예시

  • 귀뚜라미는 날씨가 더운 날 더 자주 우는 것으로 추정이 된다.

선형 회귀 귀뚜라미.png

  • 그래서 온도에 따른 우는 횟수를 측정 해 보니 위 그래프와 같이 나왔다.

선형 회귀 귀뚜라미2.png

  • 이 그래프는 파란색 선과 같은 선형 관계를 가진다.
  • 저 그래프를 그리는 수식 y = mx+b 을 알아낸다면 어떤 온도에서 귀뚜라미가 얼마나 우는지, 또는 귀뚜라미가 얼마나 울면 어느 정도의 온도인지 알 수 있다.

선형 회귀의 4가지 기본가정

줄여서 LINE이라고 외우기도 하지만 한국의 기술사 학원 등에서 만들어낸 것으로 보인다. 전 세계적으론 CRUD, ACID, CIA, SOLID 처럼 통용되진 않는다.

  • 선형성(Linearity): 독립변수(X)과 종속변수(Y)가 선형 관계에 있음
  • 독립성(Independence): 종속변수는 다른 종속변수의 값에 의해 영향을 받지 않음
  • 정규성(Normality): 오차항은 다변량 정규분포를 띔
  • 등분산성(Homoscedasticity): 오차항의 분산은 모든 종속변수에 대해 동일함
    • Equal Variance 라고도 불리지만 주로 한국에서 외우기 쉽게 번역한 것이고, 학술적으로 정확하진 않다.

기계 학습

  • 위 예시는 단순한 2차원 직선 그래프를 그리지만, 실제 일상 속의 현상은 저렇게 단순하지 않은 경우가 많다.
  • 요소가 2개를 넘어서서 3차원, 4차원일 수도 있고, 직선이 아니라 곡선을 그릴 수도 있다.

선형 회귀.png

  • 이런 경우 우리가 예상되는 수식 형태 y = mx+b 등을 넣어주면, 반복적으로 계산하고 비교하고 계산하고 비교하여 결국 합리적인 선형 모델을 만들어 주는 것이 기계 학습의 기본이다.