머신러닝 파이프라인: Difference between revisions
From IT Wiki
(새 문서: 분류:인공지능 ;Machine Learning Pipeline; ML Pipeline ;머신러닝 기술을 활용함에 있어서 초기 기획부터 데이터 수집·가공, 분석과 사후관리까...) |
No edit summary |
||
Line 6: | Line 6: | ||
== 머신러닝의 세부 업무 분야 == | == 머신러닝의 세부 업무 분야 == | ||
* 머신러닝을 적용하기 위해선 수많은 선행, 후행 작업들 수행 필요 | * 머신러닝을 적용하기 위해선 수많은 선행, 후행 작업들 수행 필요 | ||
[[파일:머신러닝 세부 업무 분야.jpg]] | [[파일:머신러닝 세부 업무 분야.jpg|700px]] | ||
== 머신러닝 파이프라인 == | == 머신러닝 파이프라인 == | ||
* 많은 작업들을 일련의 흐름으로 정의하여 순차적으로 실행 | * 많은 작업들을 일련의 흐름으로 정의하여 순차적으로 실행 | ||
[[파일:머신러닝 파이프라인 예시.jpg]] | [[파일:머신러닝 파이프라인 예시.jpg|700px]] | ||
* Load data : 데이터 수집, 적재 | * Load data : 데이터 수집, 적재 | ||
* Data analysis : 데이터 분석 | * Data analysis : 데이터 분석 |
Revision as of 20:13, 10 May 2020
- Machine Learning Pipeline; ML Pipeline
- 머신러닝 기술을 활용함에 있어서 초기 기획부터 데이터 수집·가공, 분석과 사후관리까지 일련의 전체 과정
- 머신러닝 파이프라이닝은 이런 일련의 과정을 설계하고 관리하는 것을 의미한다.
머신러닝의 세부 업무 분야
- 머신러닝을 적용하기 위해선 수많은 선행, 후행 작업들 수행 필요
머신러닝 파이프라인
- 많은 작업들을 일련의 흐름으로 정의하여 순차적으로 실행
- Load data : 데이터 수집, 적재
- Data analysis : 데이터 분석
- Feature Engineering : 데이터의 특성 파악, 전처리 수행
- Data validation : 전처리된 데이터 검증
- Data Split : 교차 검증을 위한 데이터 분리
- Build & Train Model : 머신러닝, 딥러닝 모델을 구축하고 훈련 진행
- Model Validation : 모델 검증
- Model Serving : 모델 기록·보관
관련 도구
- 큐브플로우