익명 사용자
로그인하지 않음
토론
기여
계정 만들기
로그인
IT위키
검색
강화 학습: 두 판 사이의 차이
IT위키
이름공간
문서
토론
더 보기
더 보기
문서 행위
읽기
편집
원본 편집
역사
2019년 10월 28일 (월) 20:53 판
(
편집
)
223.38.21.59
(
토론
)
(새 문서:
분류:인공지능
;Reinforcement learning ;
머신러닝
의 학습 모델로, 현재 상태에서 어떤 행동(Action)을 하면 가장 보상(Reward)를 많이 받을 지...)
다음 편집 →
(차이 없음)
2019년 10월 28일 (월) 20:53 판
Reinforcement learning
머신러닝
의 학습 모델로, 현재 상태에서 어떤 행동(Action)을 하면 가장 보상(Reward)를 많이 받을 지 스스로 학습하는 모델
행동 심리학을 기반으로 고안됨
분류
:
인공지능
둘러보기
둘러보기
대문
최근 바뀜
분류별 보기
일반 IT용어
프로젝트 관리
디지털 서비스
블록체인
인공지능
소프트웨어 공학
운영체제
컴퓨터 구조
자료 구조
데이터 과학
데이터베이스
네트워크
프로토콜
보안
컴플라이언스
개인정보보호
표준
경영학
기업 IT
조직/단체
광고
위키 도구
위키 도구
특수 문서 목록
이 문서 인용하기
문서 도구
문서 도구
사용자 문서 도구
더 보기
여기를 가리키는 문서
가리키는 글의 최근 바뀜
인쇄용 판
고유 링크
문서 정보
문서 기록
분류 목록
분류 목록
인공지능