마르코프 결정 프로세스: 두 판 사이의 차이

IT위키
(새 문서: 분류:인공지능 ;MDP; Markov Decision Process == 특징 == * Stochastic: 다음 결과는 확률적으로 결정됨 * Partially Observable: 전체 결정 과정을 조망할...)
 
편집 요약 없음
21번째 줄: 21번째 줄:
| T || 전이확률, T(s', a, s)
| T || 전이확률, T(s', a, s)
|}
|}
== 같이 보기 ==
* [[머신러닝]]
* [[강화 학습]]
* [[은닉 마르코프 모델]]

2019년 10월 28일 (월) 21:53 판

MDP; Markov Decision Process

특징

  • Stochastic: 다음 결과는 확률적으로 결정됨
  • Partially Observable: 전체 결정 과정을 조망할 수 없음

구성

구성 설명
S 상태의 유한 집합
A 행동의 유한 집합
R 보상 기대값, R(s, a)
r 차감 요인, 0~1
T 전이확률, T(s', a, s)

같이 보기