데이터 전처리: 두 판 사이의 차이
IT위키
잔글 (문자열 찾아 바꾸기 - "분류:데이터 분석" 문자열을 "분류:데이터/통계학" 문자열로) |
편집 요약 없음 |
||
2번째 줄: | 2번째 줄: | ||
;Data Preprocessing | ;Data Preprocessing | ||
;데이터를 실제 업무에 활용하기에 앞서서 정제하는 행위 | ;데이터를 실제 업무에 활용하기에 앞서서 정제하는 행위 | ||
== 데이터 전처리 부담 == | |||
* 데이터 분석가는 업무 시간 중 80%정도를 데이터 수집 및 전처리 과정에 사용<ref>[http://www.forbes.com/sites/gilpress/2016/03/23/data-preparation-most-time-consuming-least-enjoyable-data-science-task-survey-says/#16ece2467f75 Forbes에서 인용한 CrowdFlower의 설문 결과]</ref> | |||
== 유형 == | == 유형 == | ||
19번째 줄: | 22번째 줄: | ||
** 암호화: [[동형암호]] | ** 암호화: [[동형암호]] | ||
** 민감속성 제거 | ** 민감속성 제거 | ||
== 참고 문헌 == |