머신러닝 파이프라인: Difference between revisions

From IT Wiki
(새 문서: 분류:인공지능 ;Machine Learning Pipeline; ML Pipeline ;머신러닝 기술을 활용함에 있어서 초기 기획부터 데이터 수집·가공, 분석과 사후관리까...)
 
No edit summary
Line 6: Line 6:
== 머신러닝의 세부 업무 분야 ==
== 머신러닝의 세부 업무 분야 ==
* 머신러닝을 적용하기 위해선 수많은 선행, 후행 작업들 수행 필요
* 머신러닝을 적용하기 위해선 수많은 선행, 후행 작업들 수행 필요
[[파일:머신러닝 세부 업무 분야.jpg]]
[[파일:머신러닝 세부 업무 분야.jpg|700px]]


== 머신러닝 파이프라인 ==
== 머신러닝 파이프라인 ==
* 많은 작업들을 일련의 흐름으로 정의하여 순차적으로 실행
* 많은 작업들을 일련의 흐름으로 정의하여 순차적으로 실행
[[파일:머신러닝 파이프라인 예시.jpg]]
[[파일:머신러닝 파이프라인 예시.jpg|700px]]
* Load data : 데이터 수집, 적재
* Load data : 데이터 수집, 적재
* Data analysis : 데이터 분석
* Data analysis : 데이터 분석

Revision as of 20:13, 10 May 2020

Machine Learning Pipeline; ML Pipeline
머신러닝 기술을 활용함에 있어서 초기 기획부터 데이터 수집·가공, 분석과 사후관리까지 일련의 전체 과정
  • 머신러닝 파이프라이닝은 이런 일련의 과정을 설계하고 관리하는 것을 의미한다.

머신러닝의 세부 업무 분야

  • 머신러닝을 적용하기 위해선 수많은 선행, 후행 작업들 수행 필요

머신러닝 세부 업무 분야.jpg

머신러닝 파이프라인

  • 많은 작업들을 일련의 흐름으로 정의하여 순차적으로 실행

머신러닝 파이프라인 예시.jpg

  • Load data : 데이터 수집, 적재
  • Data analysis : 데이터 분석
  • Feature Engineering : 데이터의 특성 파악, 전처리 수행
  • Data validation : 전처리된 데이터 검증
  • Data Split : 교차 검증을 위한 데이터 분리
  • Build & Train Model : 머신러닝, 딥러닝 모델을 구축하고 훈련 진행
  • Model Validation : 모델 검증
  • Model Serving : 모델 기록·보관

관련 도구

  • 큐브플로우

참고 문헌