이상치: Difference between revisions

From IT Wiki
(새 문서: 분류:데이터 과학 ;Outlier == 이상치의 종류 == * '''의도하지 않게 잘못 입력된 이상치(Bad Data)''' ** 분석 목적에 부합되지 안항 제거해야...)
 
 
(One intermediate revision by one other user not shown)
Line 4: Line 4:
== 이상치의 종류 ==
== 이상치의 종류 ==
* '''의도하지 않게 잘못 입력된 이상치(Bad Data)'''
* '''의도하지 않게 잘못 입력된 이상치(Bad Data)'''
** 분석 목적에 부합되지 안항 제거해야 하는 이상치
** 분석 목적에 부합되지 않아 제거해야 하는 이상치
** 이상치 자체로 의미가 있어 분석 대상에 포함해야 하는 이상치
** 이상치 자체로 의미가 있어 분석 대상에 포함해야 하는 이상치
* '''의도적으로 잘못 입력된 이상치(Fraud)'''
* '''의도적으로 잘못 입력된 이상치(Fraud)'''
Line 10: Line 10:
== 이상치 탐지 ==
== 이상치 탐지 ==
* [[박스플롯]]을 이용하면 이상치를 쉽게 감지할 수 있다.
* [[박스플롯]]을 이용하면 이상치를 쉽게 감지할 수 있다.
[[파일:Boxplot2.png]]
[[파일:Boxplot2.png|500px]]


== 같이 보기 ==
== 같이 보기 ==
* [[결측치]]
* [[결측치]]

Latest revision as of 21:26, 15 May 2023

Outlier

이상치의 종류[edit | edit source]

  • 의도하지 않게 잘못 입력된 이상치(Bad Data)
    • 분석 목적에 부합되지 않아 제거해야 하는 이상치
    • 이상치 자체로 의미가 있어 분석 대상에 포함해야 하는 이상치
  • 의도적으로 잘못 입력된 이상치(Fraud)

이상치 탐지[edit | edit source]

  • 박스플롯을 이용하면 이상치를 쉽게 감지할 수 있다.

Boxplot2.png

같이 보기[edit | edit source]