머신러닝 파이프라인
From IT Wiki
- Machine Learning Pipeline; ML Pipeline
- 머신러닝 기술을 활용함에 있어서 초기 기획부터 데이터 수집·가공, 분석과 사후관리까지 일련의 전체 과정
- 머신러닝 파이프라이닝은 이런 일련의 과정을 설계하고 관리하는 것을 의미한다.
머신러닝의 세부 업무 분야
- 머신러닝을 적용하기 위해선 수많은 선행, 후행 작업들 수행 필요
머신러닝 파이프라인
- 많은 작업들을 일련의 흐름으로 정의하여 순차적으로 실행
- Load data : 데이터 수집, 적재
- Data analysis : 데이터 분석
- Feature Engineering : 데이터의 특성 파악, 전처리 수행
- Data validation : 전처리된 데이터 검증
- Data Split : 교차 검증을 위한 데이터 분리
- Build & Train Model : 머신러닝, 딥러닝 모델을 구축하고 훈련 진행
- Model Validation : 모델 검증
- Model Serving : 모델 기록·보관
관련 도구
- 큐브플로우