ヒューリスティック報酬観察空間進化を通じてユニバーサルLLM報酬デザインの向上 | Synapse