데이터 파이프라인: Difference between revisions

From IT Wiki
(새 문서: 분류:데이터 분석 ;데이터의 흐름, 그 흐름 과정에서 이루어지는 전방위적 처리과정을 수행하는 시스템, 또는 매커니즘 == 특징 == * 병...)
 
m (문자열 찾아 바꾸기 - "분류:데이터/통계학" 문자열을 "분류:데이터 과학" 문자열로)
 
(2 intermediate revisions by 2 users not shown)
Line 1: Line 1:
[[분류:데이터 분석]]
[[분류:데이터 과학]]
;데이터의 흐름, 그 흐름 과정에서 이루어지는 전방위적 처리과정을 수행하는 시스템, 또는 매커니즘
;데이터의 흐름, 그 흐름 과정에서 이루어지는 전방위적 처리과정을 수행하는 시스템, 또는 매커니즘


== 특징 ==
== 특징 ==
* 병렬 처리
* 병렬 처리
* 대규모 및 실시간
* 자동화
* 자동화



Latest revision as of 00:04, 7 May 2020

데이터의 흐름, 그 흐름 과정에서 이루어지는 전방위적 처리과정을 수행하는 시스템, 또는 매커니즘

특징[edit | edit source]

  • 병렬 처리
  • 대규모 및 실시간
  • 자동화

수행 기능[edit | edit source]

  • 추출(extracting)
  • 변경(transforming)
  • 결합(combining)
  • 검증(validating)
  • 적재(loading)

ETL과의 차이[edit | edit source]

  • 데이터 파이프라인은 ETL을 서브셋으로 포함하는 광범위한 용어