머신러닝: Difference between revisions

From IT Wiki
No edit summary
No edit summary
Line 38: Line 38:
** ex) 얼굴(큰 차원) 이미지에서 코, 눈(작은 차원) 등의 이미지에서 숫자를 추출
** ex) 얼굴(큰 차원) 이미지에서 코, 눈(작은 차원) 등의 이미지에서 숫자를 추출


== 설계 절차 ==
== 구현 절차 ==
* 데이터 전처리: 벡터화, [[레이블링]], [[결측치]] 처리
# 데이터 전처리: 벡터화, [[레이블링]], [[결측치]] 처리
* 수치 분석: [[원핫 인코딩]], Feature(Factor) 선정
# 수치 분석: [[원핫 인코딩]], Feature(Factor) 선정
* 모델 선택: 적합 모델 선정 또는 전이학습
# 모델 선택: 적합 모델 선정 또는 전이학습
* [[하이퍼 파라미터]] 튜닝: 모델의 계층, 유닛, [[활성화 함수]], 학습비율 등
# [[하이퍼 파라미터]] 튜닝: 모델의 계층, 유닛, [[활성화 함수]], 학습비율 등
* 모델 테스트 및 분석: 학습된 모델의 성능의 측정, 분석 및 성능 개선
# 모델 테스트 및 분석: 학습된 모델의 성능의 측정, 분석 및 성능 개선
* 모델 제공 및 관리: 실제 응용 분야에 적용하고 지속적으로 관리
# 모델 제공 및 관리: 실제 응용 분야에 적용하고 지속적으로 관리

Revision as of 16:51, 28 December 2019

Machine learning
인공지능 연구분야 중 하나로, 인간의 뇌가 자연스럽게 수행하는 학습 능력을 컴퓨터로 구현하는 기술

머신러닝과 딥러닝

  • 인공 지능 : 자연 언어 처리, 전문가 시스템 분야, 영상 분석, 이론 증명(수학적 증명)
  • 머신 러닝 : 선형 회귀, 로지스틱 회귀, 소프트 맥스, 신경망(neural net)
  • 딥 러닝 : 신경망을 3 개 이상 중첩, CNN(이미지 인식 기능), RNN(자연어 처리, 챗봇)

분류

머신러닝 활용

  • 클래스 분류(Classification)
    • 특정 데이터에 레이블(정답)을 붙여 분류
    • ex) 스팸 메일 분류, 필기 인식 등
  • 클러스터링(Clustering)
    • 값의 유사성을 기반으로 데이터를 여러 그룹으로 나눔
    • ex) 고객의 여러 가지 정보를 이용하여 그룹핑한 다음 최우수/우수/일반 고객 등으로 분류
  • 추천(Recommendation)
    • 특정 데이터를 기반으로 다른 데이터를 추천하는 것
    • ex) 사용자의 구매기록을 기반으로 다른 상품 추천
  • 회귀(Regression)
    • 과거의 데이터로 미래의 데이터를 예측하는 것
    • ex) 주변 부동산 시세 정보를 이용하여 내년의 집값을 예측
  • 차원 축소
    • 데이터의 특성을 유지하면서 데이터의 양을 줄이는 것
    • ex) 얼굴(큰 차원) 이미지에서 코, 눈(작은 차원) 등의 이미지에서 숫자를 추출

구현 절차

  1. 데이터 전처리: 벡터화, 레이블링, 결측치 처리
  2. 수치 분석: 원핫 인코딩, Feature(Factor) 선정
  3. 모델 선택: 적합 모델 선정 또는 전이학습
  4. 하이퍼 파라미터 튜닝: 모델의 계층, 유닛, 활성화 함수, 학습비율 등
  5. 모델 테스트 및 분석: 학습된 모델의 성능의 측정, 분석 및 성능 개선
  6. 모델 제공 및 관리: 실제 응용 분야에 적용하고 지속적으로 관리