最近の研究により、さまざまな時系列アプリケーションにおいて事前学習された大規模言語モデル(LLM)を利用することへの関心が高まっています。しかし、LLMを時系列予測の基盤モデルとして使用する際には、主に以下の3つの課題があります:(1) ドメイン間一般化。(2) モダリティ間の整合性。(3) 自己回帰フレームワークにおける誤差の蓄積。これらの課題に対処するために、私たちはLangTimeを提案しました。LangTimeは、強化学習に基づくファインチューニングを組み込んだ時系列予測のための言語ガイド付き統一モデルです。具体的には、LangTimeは、ドメイン適応を促進し、時系列を単一トークンに凝縮するために、データセットごとおよびチャネルごとの指示を含む時間的理解プロンプト(TCP)を構築します。これにより、LLMが時間データをよりよく理解し、整合させることが可能になります。自己回帰予測を改善するために、私たちはTimePPOという強化学習ベースのファインチューニングアルゴリズムを導入します。TimePPOは、時系列に特化した多次元報酬関数と繰り返しベースの価値評価戦略を活用することで、誤差の蓄積を軽減します。広範な実験により、LangTimeが最先端のドメイン間予測性能を達成し、TimePPOのファインチューニングが自己回帰予測の安定性と精度を効果的に向上させることが実証されました。
Niu et al. (Tue,) はこの問題を研究しました。
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: