이상치: Difference between revisions

From IT Wiki
(새 문서: 분류:데이터 과학 ;Outlier == 이상치의 종류 == * '''의도하지 않게 잘못 입력된 이상치(Bad Data)''' ** 분석 목적에 부합되지 안항 제거해야...)
 
No edit summary
Line 10: Line 10:
== 이상치 탐지 ==
== 이상치 탐지 ==
* [[박스플롯]]을 이용하면 이상치를 쉽게 감지할 수 있다.
* [[박스플롯]]을 이용하면 이상치를 쉽게 감지할 수 있다.
[[파일:Boxplot2.png]]
[[파일:Boxplot2.png|500px]]


== 같이 보기 ==
== 같이 보기 ==
* [[결측치]]
* [[결측치]]

Revision as of 16:41, 21 March 2020

Outlier

이상치의 종류

  • 의도하지 않게 잘못 입력된 이상치(Bad Data)
    • 분석 목적에 부합되지 안항 제거해야 하는 이상치
    • 이상치 자체로 의미가 있어 분석 대상에 포함해야 하는 이상치
  • 의도적으로 잘못 입력된 이상치(Fraud)

이상치 탐지

  • 박스플롯을 이용하면 이상치를 쉽게 감지할 수 있다.

Boxplot2.png

같이 보기