Anonymous
Not logged in
Talk
Contributions
Create account
Log in
IT Wiki
Search
데이터 전처리
From IT Wiki
Namespaces
Page
Discussion
More
More
Page actions
Read
Edit
Edit source
History
Revision as of 00:07, 7 May 2020 by
Itwiki
(
talk
|
contribs
)
(문자열 찾아 바꾸기 - "
분류:데이터/통계학
" 문자열을 "
분류:데이터 과학
" 문자열로)
(
diff
)
← Older revision
| Latest revision (diff) | Newer revision → (diff)
Data Preprocessing
데이터를 실제 업무에 활용하기에 앞서서 정제하는 행위
데이터 전처리 부담
데이터 분석가는 업무 시간 중 80%정도를 데이터 수집 및 전처리 과정에 사용
[1]
유형
데이터 품질 향상
이상치 처리
결측치
처리
노이즈 제거
오타 처리
개행문자 등 특수문자 처리
데이터 통일
메타 데이터 조정: 칼럼명 통일
데이터 형태 조정: Data Type, Datetime Type,
원핫 인코딩
연계 정보 조정: 불필요 칼럼 삭제, 칼럼 추가 등
개인정보 보호
노이즈 추가:
차분 프라이버시
식별자 제거:
개인정보 비식별화
암호화:
동형암호
민감속성 제거
참고 문헌
↑
Forbes에서 인용한 CrowdFlower의 설문 결과
Category
:
데이터 과학
Navigation
Navigation
Main page
Recent changes
분류별 보기
일반 IT용어
프로젝트 관리
디지털 서비스
블록체인
인공지능
소프트웨어 공학
운영체제
컴퓨터 구조
자료 구조
데이터 과학
데이터베이스
네트워크
프로토콜
보안
컴플라이언스
개인정보보호
표준
경영학
기업 IT
조직/단체
Advertisements
Wiki tools
Wiki tools
Special pages
Cite this page
Page tools
Page tools
User page tools
More
What links here
Related changes
Printable version
Permanent link
Page information
Page logs
Categories
Categories
데이터 과학