가치에 기반한 결정은 인지의 초석이지만, 그 근본적인 회로 수준 메커니즘은 여전히 명확하지 않다. 우리는 다양한 경제적 선택 과제에 대해 Dale의 법칙이 적용된 순환 신경망 모델을 강화 학습을 통해 훈련시켜 두 단계의 계산 프레임워크를 밝혀냈다. 첫째, 가치 추정은 입력 수준에서 일어나며, 학습된 가중치는 주관적 선호를 저장하고 보상 크기와 확률의 비선형 곱셈을 근사하여 기대 가치를 산출한다. 이 전방향(feedforward) 메커니즘은 새로운 선택 옵션에 대한 일반화를 가능하게 한다. 둘째, 선택지의 가치는 순환 네트워크 내에서 비교되며, 특정 연결 양식이 승자독식 결정(winner-take-all)을 매개하고 흥분성 및 억제성 뉴런 모두 가치 및 선택 특이성을 나타낸다. 단일 네트워크를 여러 과제에 걸쳐 훈련하여, 공유된 계산 스키마와 특화된 신경 모듈을 결합한 조합적 표현을 보였다. 원숭이의 안와전두피질에서의 주요 신경생리학적 발견을 재현한 본 모델은 가치 계산, 비교 및 일반화를 일관된 프레임워크로 통합하며 검증 가능한 예측을 제시한다.
Battista 등(Sun,)이 이 문제를 연구했다.