Key points are not available for this paper at this time.
私たちは最初にPDB内の6684の非ホモログ単一ドメインタンパク質に対してギャップのない全体間構造マッチを行い、TMスコアが極値分布に従うことを発見しました。このデータにより、任意に選んだ二つのタンパク質が同じまたはそれ以上のTMスコアを得る確率を測るP値を各TMスコアに割り当てることができます。たとえば、TMスコアが0.5のとき、そのP値は5.5 x 10(-7)であり、TMスコアが0.5以上を取得するためには少なくとも180万のランダムなタンパク質ペアを考慮する必要があることを意味します。次に、SCOP、CATH、SCOPとCATHの合意の三つのデータセットから同じフォールドのタンパク質の事後確率を調べます。異なるデータセットからの事後確率がTMスコア=0.5の周りで類似した急速な相転移を示すことがわかりました。この発見は、TMスコアがタンパク質トポロジー分類のための近似的ながら定量的な基準として使用できることを示しています。すなわち、TMスコア >0.5のタンパク質ペアは主に同じフォールドにあり、TMスコア <0.5のものは主に異なるフォールドにあるということです。
Xu et al. (Wed,) はこの問題を研究しました。