이상치: 두 판 사이의 차이
IT위키
(새 문서: 분류:데이터 과학 ;Outlier == 이상치의 종류 == * '''의도하지 않게 잘못 입력된 이상치(Bad Data)''' ** 분석 목적에 부합되지 안항 제거해야...) |
|||
(다른 사용자 한 명의 중간 판 하나는 보이지 않습니다) | |||
4번째 줄: | 4번째 줄: | ||
== 이상치의 종류 == | == 이상치의 종류 == | ||
* '''의도하지 않게 잘못 입력된 이상치(Bad Data)''' | * '''의도하지 않게 잘못 입력된 이상치(Bad Data)''' | ||
** 분석 목적에 부합되지 | ** 분석 목적에 부합되지 않아 제거해야 하는 이상치 | ||
** 이상치 자체로 의미가 있어 분석 대상에 포함해야 하는 이상치 | ** 이상치 자체로 의미가 있어 분석 대상에 포함해야 하는 이상치 | ||
* '''의도적으로 잘못 입력된 이상치(Fraud)''' | * '''의도적으로 잘못 입력된 이상치(Fraud)''' | ||
10번째 줄: | 10번째 줄: | ||
== 이상치 탐지 == | == 이상치 탐지 == | ||
* [[박스플롯]]을 이용하면 이상치를 쉽게 감지할 수 있다. | * [[박스플롯]]을 이용하면 이상치를 쉽게 감지할 수 있다. | ||
[[파일:Boxplot2.png]] | [[파일:Boxplot2.png|500px]] | ||
== 같이 보기 == | == 같이 보기 == | ||
* [[결측치]] | * [[결측치]] |