議論型大規模言語モデルにおける不確実性定量化手法の評価 | Synapse