Key points are not available for this paper at this time.
할인이 있는 무한 지평선에서 알 수 없는 매개변수를 가진 확률적 과정 제어 문제를 고려한다. 에이전트는 분포의 형태로 알 수 없는 매개변수에 대한 믿음을 표현한다. 일반적인 조건 하에서 믿음의 수열은 한계 분포로 수렴한다. 한계 분포는 진정한 매개변수 값에 집중될 수도 있고 그렇지 않을 수도 있다. 어떤 경우에는 완전한 학습이 최적이지만, 다른 경우에는 최적 전략이 완전한 학습을 의미하지 않는다. 본 논문은 몇 가지 특수 사례를 검토하고 불완전 학습이 최적인 예를 생성하는 절차에 대한 논의로 결론을 맺는다. 저작권 1988 Econometric Society.
Easley 외 (목요일)은 이 질문을 연구했다.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: