데이터 파이프라인: 두 판 사이의 차이
IT위키
(새 문서: 분류:데이터 분석 ;데이터의 흐름, 그 흐름 과정에서 이루어지는 전방위적 처리과정을 수행하는 시스템, 또는 매커니즘 == 특징 == * 병...) |
편집 요약 없음 |
||
4번째 줄: | 4번째 줄: | ||
== 특징 == | == 특징 == | ||
* 병렬 처리 | * 병렬 처리 | ||
* 대규모 및 실시간 | |||
* 자동화 | * 자동화 | ||
2020년 1월 8일 (수) 11:07 판
- 데이터의 흐름, 그 흐름 과정에서 이루어지는 전방위적 처리과정을 수행하는 시스템, 또는 매커니즘
특징
- 병렬 처리
- 대규모 및 실시간
- 자동화
수행 기능
- 추출(extracting)
- 변경(transforming)
- 결합(combining)
- 검증(validating)
- 적재(loading)
ETL과의 차이
- 데이터 파이프라인은 ETL을 서브셋으로 포함하는 광범위한 용어