September 30, 2025Open Access

PathBench: がん精密医療に向けた病理基盤モデルの包括的比較ベンチマーク

Key Points

PathBenchは、複数のがんタイプにわたる病理基盤モデルの包括的評価を可能にし、臨床適用性を向上させます。
このベンチマークは19のモデルを評価し、Virchow2とH-Optimus-1が診断および予後において最も効果的であることを明らかにしました。
このフレームワークはプライベートな医療データセットを使用し、プレトレーニングデータを除外することで潜在的なデータ漏洩およびバイアスを排除します。
評価は15,888の全スライド画像から64以上のタスクを網羅し、臨床現場の複雑さを示すものとして、より深いインサイトを提供します。

Abstract

病理基盤モデルの出現は計算病理学に革命をもたらし、がん診断および予後評価の向上を目的とした、高精度で一般化された全スライド画像分析を可能にしました。これらのモデルはがん診断および予後において驚異的な可能性を示していますが、臨床への移行には、がんの種類ごとの最適モデルの変動、評価におけるデータ漏洩の可能性、標準化されたベンチマークの欠如など、重要な課題が存在します。厳密かつ偏りのない評価がなければ、最も先進的なPFMでさえ研究設定に留まるリスクがあり、命を救う応用が遅れる可能性があります。既存のベンチマーキング努力は、狭いがんタイプの焦点、潜在的なプレトレーニングデータの重複、または不完全なタスクカバレッジにより制限されている。私たちはPathBenchを提案します。これは、一般的ながんに対して多施設の社内データセットを用い、厳格な漏洩防止を図り、診断から予後までの臨床全体のスペクトルを通じた評価を行い、継続的なモデル評価のための自動化されたリーダーボードシステムを備えた、これらのギャップに取り組む初の包括的ベンチマークです。我々のフレームワークは大規模データを取り入れ、PFMの客観的な比較を可能にし、現実の臨床の複雑さを反映させます。全ての評価データはプライベートな医療提供者から取得し、データ漏洩のリスクを避けるためにプレトレーニングの使用を厳格に除外しています。私たちは、10の病院から8,549人の患者から15,888のWSIを収集し、64以上の診断および予後タスクを網羅しています。現在、19のPFMの評価から、Virchow2とH-Optimus-1が全体で最も効果的なモデルであることが示されています。この研究は、研究者にモデル開発のための堅牢なプラットフォームを提供し、臨床医には異なる臨床シナリオにおけるPFMのパフォーマンスに関する実用的なインサイトを提供し、最終的にはこれらの変革的技術を日常の病理実践に取り入れる加速を図ります。

Read Full Paperexternally

AIに質問

Bookmark

View Full Paper