大規模言語モデル(LLM)の性能向上の主流戦略は歴史的にスケーリングに依存してきました:パラメータ数の増加、コンテキストウィンドウの拡大、計算予算の増大です。このパラダイムは定義された範囲内では効果的ですが、大量の文書コーパスの分析、多段階の論理的推論、高精度が要求されるエンタープライズグレードの推論タスクに適用すると構造的な劣化が生じます。本論文では、これらの制約に brute-forceスケーリングではなく構造的インテリジェンスによって対処する二つの相補的建築的イノベーション、再帰言語モデル(RLMs)とエージェント型検索強化生成(Agentic RAG)を厳密に技術的に検討します。理論的基盤、動作メカニズム、実証的パフォーマンスプロファイル、業界横断的な示唆をそれぞれ独立に分析し、その後、統合推論スタックとしての相乗的統合を考察します。OOLONG-Pairs、BrowseComp-Plus、Clinical QA、Regulatory Complianceのベンチマーク評価により、RLM–Agentic RAG統合アーキテクチャは複雑な分析タスクで88~94%の精度を達成し、従来の長文コンテキストLLMベースラインに比べ4.7倍のトークン効率を示します。これら二つのパラダイムの収束は、知的システムが情報を処理、検索、統合する方法に基盤的変革をもたらし、精密性が極めて重要な産業領域に変革的な影響を及ぼすことを示しています。
プラティーク・ダッタ(サタデー)はこの問題を研究しました。