이상치: 두 판 사이의 차이

IT위키
(새 문서: 분류:데이터 과학 ;Outlier == 이상치의 종류 == * '''의도하지 않게 잘못 입력된 이상치(Bad Data)''' ** 분석 목적에 부합되지 안항 제거해야...)
 
 
(다른 사용자 한 명의 중간 판 하나는 보이지 않습니다)
4번째 줄: 4번째 줄:
== 이상치의 종류 ==
== 이상치의 종류 ==
* '''의도하지 않게 잘못 입력된 이상치(Bad Data)'''
* '''의도하지 않게 잘못 입력된 이상치(Bad Data)'''
** 분석 목적에 부합되지 안항 제거해야 하는 이상치
** 분석 목적에 부합되지 않아 제거해야 하는 이상치
** 이상치 자체로 의미가 있어 분석 대상에 포함해야 하는 이상치
** 이상치 자체로 의미가 있어 분석 대상에 포함해야 하는 이상치
* '''의도적으로 잘못 입력된 이상치(Fraud)'''
* '''의도적으로 잘못 입력된 이상치(Fraud)'''
10번째 줄: 10번째 줄:
== 이상치 탐지 ==
== 이상치 탐지 ==
* [[박스플롯]]을 이용하면 이상치를 쉽게 감지할 수 있다.
* [[박스플롯]]을 이용하면 이상치를 쉽게 감지할 수 있다.
[[파일:Boxplot2.png]]
[[파일:Boxplot2.png|500px]]


== 같이 보기 ==
== 같이 보기 ==
* [[결측치]]
* [[결측치]]

2023년 5월 15일 (월) 21:26 기준 최신판

Outlier

이상치의 종류[편집 | 원본 편집]

  • 의도하지 않게 잘못 입력된 이상치(Bad Data)
    • 분석 목적에 부합되지 않아 제거해야 하는 이상치
    • 이상치 자체로 의미가 있어 분석 대상에 포함해야 하는 이상치
  • 의도적으로 잘못 입력된 이상치(Fraud)

이상치 탐지[편집 | 원본 편집]

  • 박스플롯을 이용하면 이상치를 쉽게 감지할 수 있다.

Boxplot2.png

같이 보기[편집 | 원본 편집]