大規模言語モデル時代における動画キャプション作成に関する調査 | Synapse