What type of study is this?

This is a Quantitative Study study.

September 29, 2025Open Access

LangTime: プロキシマルポリシー最適化を用いた時系列予測のための言語ガイド付き統一モデル

Key Points

LangTimeは、複数のドメインにおける時系列予測で最先端の性能を達成しています。
モデルは、データ理解と整合性を向上させるために時間的理解プロンプトを効果的に活用します。
TimePPOは、特化した報酬関数を通じて自己回帰フレームワークにおける誤差の蓄積を大幅に減少させます。
広範な実験により、ドメイン間の時系列アプリケーションに対する言語ガイド付きモデルの使用の利点が確認されました。

Abstract

最近の研究により、さまざまな時系列アプリケーションにおいて事前学習された大規模言語モデル（LLM）を利用することへの関心が高まっています。しかし、LLMを時系列予測の基盤モデルとして使用する際には、主に以下の3つの課題があります：(1) ドメイン間一般化。(2) モダリティ間の整合性。(3) 自己回帰フレームワークにおける誤差の蓄積。これらの課題に対処するために、私たちはLangTimeを提案しました。LangTimeは、強化学習に基づくファインチューニングを組み込んだ時系列予測のための言語ガイド付き統一モデルです。具体的には、LangTimeは、ドメイン適応を促進し、時系列を単一トークンに凝縮するために、データセットごとおよびチャネルごとの指示を含む時間的理解プロンプト（TCP）を構築します。これにより、LLMが時間データをよりよく理解し、整合させることが可能になります。自己回帰予測を改善するために、私たちはTimePPOという強化学習ベースのファインチューニングアルゴリズムを導入します。TimePPOは、時系列に特化した多次元報酬関数と繰り返しベースの価値評価戦略を活用することで、誤差の蓄積を軽減します。広範な実験により、LangTimeが最先端のドメイン間予測性能を達成し、TimePPOのファインチューニングが自己回帰予測の安定性と精度を効果的に向上させることが実証されました。

LangTime: プロキシマルポリシー最適化を用いた時系列予測のための言語ガイド付き統一モデル

Key Points

Abstract

Cite This Study

Also Consider

Also Consider