마르코프 결정 프로세스: 두 판 사이의 차이
IT 위키
(새 문서: 분류:인공지능 ;MDP; Markov Decision Process == 특징 == * Stochastic: 다음 결과는 확률적으로 결정됨 * Partially Observable: 전체 결정 과정을 조망할...) |
편집 요약 없음 |
||
(같은 사용자의 중간 판 하나는 보이지 않습니다) | |||
21번째 줄: | 21번째 줄: | ||
| T || 전이확률, T(s', a, s) | | T || 전이확률, T(s', a, s) | ||
|} | |} | ||
== Q 러닝과의 비교 == | |||
;유사한 목적으로 강화학습에 사용되는 Q Learning | |||
{{MDP와 Q 러닝}} | |||
== 같이 보기 == | |||
* [[머신러닝]] | |||
* [[강화 학습]] | |||
* [[은닉 마르코프 모델]] |