익명 사용자
로그인하지 않음
토론
기여
계정 만들기
로그인
IT 위키
검색
Q-러닝
IT 위키
이름공간
문서
토론
더 보기
더 보기
문서 행위
읽기
편집
원본 편집
역사
Q-learning; Q Learning;
특정 상태에서 행동에 대한 미래값(Q)을 계산하여, 최적 정책을 찾는
마르코프 결정 프로세스
기반
강화 학습
기법
분류
:
인공지능
둘러보기
둘러보기
대문
최근 바뀜
광고
위키 도구
위키 도구
특수 문서 목록
이 문서 인용하기
문서 도구
문서 도구
사용자 문서 도구
더 보기
여기를 가리키는 문서
가리키는 글의 최근 바뀜
인쇄용 판
고유 링크
문서 정보
문서 기록
분류 목록
분류 목록
인공지능