What type of study is this?

This is a Machine Learning study (also classified as: Deep Learning, Binary Classification, Multi-Classification).

September 10, 2025Open Access

解釈可能なAIを活用したLLMテキスト帰属：人間執筆テキストと複数のLLM生成テキストの区別

Key Points

結果は、人間執筆テキストとLLM生成テキストの区別において98.5%の精度を示しました。
機械学習モデルは、78.3%の精度を示したGPTZeroなど既存ツールを上回る性能を示しました。
本研究は、テキスト帰属を強化するために二値分類と多クラス分類の両方の方法を採用しています。
解釈可能なAIが特徴の重要性に関する洞察を提供し、効果的な盗作検出を支援します。

Abstract

生成型AIの大型言語モデル（LLM）の発展により、生成型AIによって作成されたコンテンツと人間によって作成されたコンテンツを識別する必要性が高まりました。例えば、学生がこれらのツールに過度に依存することで、文章やコーディングの技能発達に影響を及ぼす問題があります。その他にも盗作の問題も含まれます。本研究は、LLMツールを用いて生成されたテキスト内容の検出と識別を支援することを目的としています。LLM生成テキストは機械学習（ML）により検出可能であると仮定し、人間と複数のLLMツールによって生成されたテキストの識別・区別が可能なMLモデルを検討しました。学生執筆テキストとLLM執筆テキストのデータセットを使用し、ランダムフォレスト（RF）やリカレントニューラルネットワーク（RNN）など複数のMLおよび深層学習（DL）アルゴリズムを活用しました。また、解釈可能な人工知能（XAI）を利用して帰属における重要な特徴を理解しました。方法は（1）人間執筆テキストとAI生成テキストの二値分類、（2）人間執筆テキストと5つの異なるLLMツール（ChatGPT、LLaMA、Google Bard、Claude、Perplexity）によるテキストを区別する多クラス分類に分かれます。結果は多クラス・二値分類共に高精度を示しました。我々のモデルは78.3%の精度を持つGPTZeroを上回り、98.5%の精度を達成しました。特にGPTZeroは約4.2%の観測値を認識できませんでしたが、我々のモデルはテストデータセット全体を認識できました。XAIの結果は、異なるクラス間の特徴重要性の理解が詳細な著者/情報源プロファイルを可能にし、固有の文体的・構造的要素を強調することで盗作検出を支援し、コンテンツの真正性を強固に検証することを示しました。

解釈可能なAIを活用したLLMテキスト帰属：人間執筆テキストと複数のLLM生成テキストの区別

Key Points

Abstract

Cite This Study

Also Consider

Also Consider