강화 학습

IT위키
223.38.21.59 (토론)님의 2019년 10월 28일 (월) 20:53 판 (새 문서: 분류:인공지능 ;Reinforcement learning ;머신러닝의 학습 모델로, 현재 상태에서 어떤 행동(Action)을 하면 가장 보상(Reward)를 많이 받을 지...)
(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)
Reinforcement learning
머신러닝의 학습 모델로, 현재 상태에서 어떤 행동(Action)을 하면 가장 보상(Reward)를 많이 받을 지 스스로 학습하는 모델
  • 행동 심리학을 기반으로 고안됨