Key points are not available for this paper at this time.
長時間かつ一貫した動画生成は、重要でありながら難しい問題として浮上しています。既存の拡散ベース動画生成モデルの多くは、画像生成モデルから派生して短時間の動画生成において有望な性能を示していますが、そのシンプルな条件付けメカニズムとサンプリング戦略は、本来画像生成用に設計されているため、長時間動画生成に適応すると性能が著しく低下します。これにより、顕著な時間的不一致や過剰露出が発生します。そこで本研究では、長時間動画生成に特化した新しい拡散モデル、FlexiFilmを紹介します。我々のフレームワークは、生成とマルチモーダル条件との間により一貫した関係を確立するための時間条件器と、過剰露出に対処するための再サンプリング戦略を組み込んでいます。実験結果は、FlexiFilmが長時間かつ一貫した動画(各30秒以上)を生成し、質的および量的分析において競合他社を上回ることを示しています。プロジェクトページ: https://y-ichen.github.io/FlexiFilm-Page/
Ouyangら(Mon、)はこの問題を研究しました。