March 3, 2026Open Access

R-Speakの開発と質的評価：表現性失語症の人々のコミュニケーションをAIで支援するスマートフォンアプリシステムの受容性と使いやすさ（プレプリント）

Key Points

R-SPEAKは参加者により良好と評価され、System Usability Scaleで平均75点を獲得しました。
質的評価を通じて、このアプリは失語症者の自立促進に役立つ可能性が示されました。
プロトタイプ開発では効果的なコミュニケーション支援を確保するため複数の大規模言語モデルを評価しました。
フィードバックにより、精度向上と処理速度改善のための更なる改良が必要であることが示されました。

Abstract

背景：失語症は、言語の理解と産出能力に影響を与える後天性の言語障害であり、効果的なコミュニケーションに大きな影響を及ぼします。GPT-5のような大規模言語モデル（LLM）は、人間のような文章や一貫した発話を生成し、失語症の個人の機能的コミュニケーションを強化する潜在力を持ちます。目的：LLMを用いたコミュニケーション支援システムを共に制作し、中等度までの失語症の人々における潜在的有用性と受容性を探ること。方法：Double Diamondアプローチを使用。フェーズ1：発見と定義；脳卒中生存者PPIグループ（n=5）と研究チームがMoSCoW優先順位付けでアイデアを開発・優先し、口頭コミュニケーションを補強するソフトウェアソリューション（R-SPEAK）を共同設計。フェーズ2：開発と実証；8つのLLMを既存のAphasiaBankデータセットで解釈評価し、チームによって承認。最良モデルでプロトタイプを開発。4名の失語症患者（PwA）と1名の介護者による半構造化面接で試験。医療専門家（HCP）フォーカスグループ（n=6）で概念とプロトタイプを評価。トピックガイドはテーマ分析から得たテーマをテクノロジー受容モデル（TAM）にマッピング。使用性はSystem Usability Scale（SUS）で評価。フェーズ3：洗練と再設計。処理速度向上のため、軽量LLM（0.5B〜3.8B）12種を臨床医が管理する対話とLLM審査フレームワークでリアルな失語発話の解釈で評価し、関連性、忠実性、完全性を測定。結果：初期ではMixtral（8×7b）が発話解釈で最良でプロトタイプに使用。PwAはSUS平均75点で良好と評価。質的データのテーマはTAMの3構成要素すべてに渡ってマッピング。使用態度：PwAは期待が高い一方、臨床医は効果に慎重。利用の容易さ：使いやすいが、他の脳卒中後障害や重度失語症の人には困難かつ訓練が必要な場合も。有用性：多くのシナリオで役立ちうる可能性があり、PwAの自立を促進。開発推奨は精度、速度の向上と個別ニーズに応じたインターフェース修正。更なる洗練でQwen（2.5:3b）が高い忠実性と1秒未満の遅延で最強性能を示し、1.5b未満のモデルは幻覚問題が顕著で臨床音声解釈のモデル容量の下限を示唆。結論：共設計したR-SPEAKプロトタイプは患者にとって受容可能と評価され、次のステップは継続的な改良と軽度から中等度失語症者を対象にした大規模な実用性試験のための電話ベースアプリ開発です。

R-Speakの開発と質的評価：表現性失語症の人々のコミュニケーションをAIで支援するスマートフォンアプリシステムの受容性と使いやすさ（プレプリント）

Key Points

Abstract

Cite This Study