ETT 편집하기
IT위키
편집을 취소할 수 있습니다. 이 편집을 되돌리려면 아래의 바뀐 내용을 확인한 후 게시해주세요.
최신판 | 당신의 편집 | ||
1번째 줄: | 1번째 줄: | ||
[[분류:데이터 분석]][[분류:데이터베이스]] | |||
;Extraction, Transformation, Transportation | |||
* Extraction: 추출 | |||
* Transformation: 가공 | |||
* Transportation: 전송 | |||
== ETT의 단계 == | |||
{| class="wikitable" | |||
|- | |||
! 단계 !! 내용 | |||
|- | |||
| 추출 | |||
|| | |||
* 원본 파일과 [[트랜잭션]] [[데이터베이스]]로부터 [[데이터 웨어하우스]]에 저장될 데이터를 추출하는 과정 | |||
* 추출의 기준이 명확해야 함 | |||
* 초기 추출(Migration) : 데이터 웨어하우스에 최초로 데이터를 구축할 때 이용 | |||
* 주기적 추출(Batch) : 데이터 웨어하우스 초기 추출 이후에 일/월 단위의 주기적인 보완 | |||
|- | |||
| 가공 | |||
|| | |||
* 질적으로 문제가 있는 데이터에 대해 데이터 정제(Cleansing) 기법을 이용 | |||
* 열(Column) 수준 : 각 도메인의 값들에 대한 정제 | |||
* 레코드 수준 : 셀렉션(Selection), 조인(Join), 집단화 기능을 이용 | |||
|- | |||
| 전송 | |||
|| | |||
* 선택된 데이터를 데이터 웨어하우스에 전송해서 저장하고, 필요한 색인을 작성 | |||
|} |