Q-러닝
From IT Wiki
Revision as of 10:19, 28 January 2020 by PE120 (talk | contribs) (새 문서: 분류:인공지능 ;Q-learning ;Q Learning; ;특정 상태에서 행동에 대한 미래값(Q)을 계산하여, 최적 정책을 찾는 마르코프 결정 프로세스 기...)
- Q-learning ;Q Learning;
- 특정 상태에서 행동에 대한 미래값(Q)을 계산하여, 최적 정책을 찾는 마르코프 결정 프로세스 기반 강화 학습 기법