데이터 전처리: 두 판 사이의 차이

IT위키
편집 요약 없음
편집 요약 없음
8번째 줄: 8번째 줄:
** [[결측치]] 처리
** [[결측치]] 처리
** 노이즈 제거
** 노이즈 제거
** 오타 처리
** 개행문자 등 특수문자 처리
* '''데이터 통일'''
* '''데이터 통일'''
** 메타 데이터 조정: 칼럼명 통일
** 메타 데이터 조정: 칼럼명 통일

2019년 12월 30일 (월) 14:31 판

Data Preprocessing
데이터를 실제 업무에 활용하기에 앞서서 정제하는 행위

유형

  • 데이터 품질 향상
    • 이상치 처리
    • 결측치 처리
    • 노이즈 제거
    • 오타 처리
    • 개행문자 등 특수문자 처리
  • 데이터 통일
    • 메타 데이터 조정: 칼럼명 통일
    • 데이터 형태 조정: Data Type, Datetime Type, 원핫 인코딩
    • 연계 정보 조정: 불필요 칼럼 삭제, 칼럼 추가 등
  • 개인정보 보호