Key points are not available for this paper at this time.
ソフトウェアシステムは、ますます規制コンプライアンスの対象となっています。規制からコンプライアンス要件を抽出することは困難です。理想的には、規制におけるコンプライアンス関連情報を特定するには、要件エンジニアと法的専門家の共同作業が必要ですが、その存在は限られています。しかし、規制は通常、数百ページにわたる長大な文書であり、法的専門用語や複雑な自然言語構造を用い、相互参照を含むため、それらの分析は労力を要します。本研究では、要件エンジニアがコンプライアンス要件に関連する法的なテキスト部分を見つけるのを支援する自動質問応答(QA)アプローチを提案します。我々のアプローチは、QA向けにファインチューニングされた大規模な言語モデルを利用しています。これにはBERTとその三つのバリアントが含まれます。我々は、四つの異なる欧州の規制文書について、専門家が手作業でキュレーションした107の質問-応答ペアに基づいて、我々のアプローチを評価します。これらの文書の中には、プライバシー関連要件の主要なソースである一般データ保護規則(GDPR)が含まれています。我々の実証的結果は、94%のケースで、我々のアプローチが与えられた質問への答えを含むテキスト部分を、最も関連性が高いとマークした上位5つの部分の中で見つけることができたことを示しています。さらに、我々のアプローチは、選択された部分において、正しい答えを平均91%の精度で特定します。
Abualhaija et al. (Mon,) はこの問題を研究しました。