N-슬롯 머신 문제: 편집 역사

IT 위키

차이 선택: 비교하려는 판의 라디오 버튼을 선택한 다음 엔터나 아래의 버튼을 누르세요.
설명: (최신) = 최신 판과 비교, (이전) = 이전 판과 비교, 잔글= 사소한 편집

    2025년 7월 8일 (화)

    • 최신이전 12:302025년 7월 8일 (화) 12:30인공무능 토론 기여 3,641 바이트 +3,641 새 문서: n-슬롯 머신 문제(n-armed bandit problem)은 강화학습에서 탐색(exploration)과 이용(exploitation)의 균형을 설명하기 위한 확률적 결정 문제로, 에이전트가 n개의 선택지 중에서 반복적으로 선택을 하며 최대 보상을 얻기 위한 전략을 학습하는 과제를 의미한다. ==개요== n-슬롯 머신 문제는 카지노의 슬롯 머신을 확장한 개념으로, 각 슬롯 머신(팔 하나짜리 도둑, bandit)은 고유의... 태그: 시각 편집