March 19, 2025Open Access

説明可能なTabNetアンサンブルモデルによる特徴選択を伴う難読化URLの特定と安全なウェブブラウジングの確保

Key Points

Key points are not available for this paper at this time.

Abstract

難読化された悪意のあるURLは、マルウェアのダウンロード、フィッシング、詐欺、広告ソフトなど、システムに対して有害なコンテンツや行動を引き起こす可能性があります。サイバーセキュリティの分野において、難読化されたUniform Resource Locator（URL）の特定は懸念される側面です。本研究では、分類のための特徴の重要性の計算に基づいた特徴抽出を用いた悪意のあるURLの特定のための堅牢な統一TabNetアンサンブルモデルを提案します。URLの特徴を抽出するために、微調整された注意ベースの深層ニューラルネットワークTabNetが使用されます。最も重要な特徴を有するカスタマイズされたデータが生成され、URLの分類のための機械学習（ML）アンサンブルモデルが開発されます。評価パラメータである精度、適合率、再現率、F1スコアが測定され、TabNetアンサンブルモデルの性能を見ることができます。97.8％の精度、0.978の適合率、0.976の再現率、0.978のF1スコアは、5つのURLクラスを分類する際の提案されたモデルの優れた結果を反映しています。モデルは、提案されたモデルのカッパ値が0.968である統計分析によってさらに検証されます。10分割交差検証モデルを使用して、平均精度97.27％と信頼区間0.004を達成しました。Local Interpretable Model-agnostic Explanations（LIME）という説明可能なAIモデルが、分類モデルに寄与する特徴を認識するためにモデルを検証するために使用されます。結果は最先端のML分類器および以前の研究と比較され、全体の検証プロセスは提案されたモデルの有効性を支持します。

AIに質問

Bookmark

View Full Paper