Key points are not available for this paper at this time.
背景:B型肝炎ウイルス(HBV)ポリメラーゼ配列の正確な解釈は、抗ウイルス耐性を特定するために不可欠であり、特にエンテカビルのような高遺伝的バリア薬において重要です。現在の耐性解釈は、主に不確実性を定量化せず、独立したデータセットで評価が難しい決定論的ルールベースのシステムに依存しています。我々の目的は、HBVポリメラーゼ配列から事前定義されたエンテカビル耐性経路を再構築するための透明な確率的フレームワークを開発し、外部検証を行うことでした。方法:HBVポリメラーゼ配列はNCBI GenBankデータベースから取得され、開発データセットを作成するために翻訳、品質管理、重複排除を通じてキュレーションされました。逆転写酵素(RT)位置は、YMDDファミリーモチーフに基づくモチーフ固定番号を用いて索引化されました。エンテカビル耐性経路の遺伝子型代理は、エンテカビル関連RT変異と組み合わせたラミブジン関連背景置換によって定義されました。確率キャリブレーションを用いたロジスティック回帰モデルが訓練され、事前に指定された性能指標およびしきい値を用いて内部検証されました。外部検証は、評価前に前処理、モデルパラメータ、およびしきい値を固定した独立したHBVdbデータセットで実施されました。結果:開発データセットは1174のユニークなポリメラーゼ配列で構成され、そのうち268が耐性経路の定義を満たしました。内部検証は、結果の決定論的遺伝子型定義と一致する完璧な識別を示しました。11,513の独立したHBVdb配列に対する外部検証は、耐性経路の有病率が著しく低いにもかかわらず(2.2%)、リポジトリ間で再現可能な性能を示し、識別が保持され、しきい値ベースの性能が安定していました。結論:本研究は、HBVにおけるエンテカビル耐性経路の確率的特定のための透明で外部検証された機械学習フレームワークを提示します。このアプローチは、確立された遺伝子型耐性定義の透明で再現可能な確率的形式を提供し、標準化された配列ベースの耐性解釈のための方法論的フレームワークとして機能する可能性があります。
Kapatais et al.(水曜日)はこの問題を研究しました。