머신러닝 파이프라인

IT위키
아이리움 (토론 | 기여)님의 2020년 5월 10일 (일) 20:12 판 (새 문서: 분류:인공지능 ;Machine Learning Pipeline; ML Pipeline ;머신러닝 기술을 활용함에 있어서 초기 기획부터 데이터 수집·가공, 분석과 사후관리까...)
(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)
Machine Learning Pipeline; ML Pipeline
머신러닝 기술을 활용함에 있어서 초기 기획부터 데이터 수집·가공, 분석과 사후관리까지 일련의 전체 과정
  • 머신러닝 파이프라이닝은 이런 일련의 과정을 설계하고 관리하는 것을 의미한다.

머신러닝의 세부 업무 분야

  • 머신러닝을 적용하기 위해선 수많은 선행, 후행 작업들 수행 필요

머신러닝 세부 업무 분야.jpg

머신러닝 파이프라인

  • 많은 작업들을 일련의 흐름으로 정의하여 순차적으로 실행

머신러닝 파이프라인 예시.jpg

  • Load data : 데이터 수집, 적재
  • Data analysis : 데이터 분석
  • Feature Engineering : 데이터의 특성 파악, 전처리 수행
  • Data validation : 전처리된 데이터 검증
  • Data Split : 교차 검증을 위한 데이터 분리
  • Build & Train Model : 머신러닝, 딥러닝 모델을 구축하고 훈련 진행
  • Model Validation : 모델 검증
  • Model Serving : 모델 기록·보관

관련 도구

  • 큐브플로우

참고 문헌