강화 학습

From IT Wiki
Revision as of 20:53, 28 October 2019 by 223.38.21.59 (talk) (새 문서: 분류:인공지능 ;Reinforcement learning ;머신러닝의 학습 모델로, 현재 상태에서 어떤 행동(Action)을 하면 가장 보상(Reward)를 많이 받을 지...)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Reinforcement learning
머신러닝의 학습 모델로, 현재 상태에서 어떤 행동(Action)을 하면 가장 보상(Reward)를 많이 받을 지 스스로 학습하는 모델
  • 행동 심리학을 기반으로 고안됨