Q 러닝: 두 판 사이의 차이
IT위키
(새 문서: 분류:인공지능 ;Q Learning; Q-learning ;특정 상태에서 행동에 대한 미래값(Q)을 계산하여, 최적 정책을 찾는 마르코프 결정 프로세스 기반...) |
(차이 없음)
|
2019년 10월 28일 (월) 22:47 판
- Q Learning; Q-learning
- 특정 상태에서 행동에 대한 미래값(Q)을 계산하여, 최적 정책을 찾는 마르코프 결정 프로세스 기반 강화 학습 기법