Key points are not available for this paper at this time.
使用深度转录组测序已识别出数千个新转录本。这一大型和“隐藏”转录组的发现重新激发了快速区分编码与非编码RNA的方法的需求。在这里,我们提出了一种新的无对齐方法——编码潜力评估工具(CPAT),该工具能够快速识别大量候选中的编码和非编码转录本。为此,CPAT使用了一个基于四个序列特征的逻辑回归模型:开放阅读框大小、开放阅读框覆盖率、Fickett TESTCODE统计量和六聚体使用偏差。CPAT软件在性能上优于其他最先进的基于对齐的软件,例如编码潜力计算器(敏感性:0.99,特异性:0.74)和Phylo密码子替代频率(敏感性:0.90,特异性:0.63)(敏感性:0.96,特异性:0.97)。除了高准确性外,CPAT的速度大约比编码潜力计算器和Phylo密码子替代频率快四个数量级,使得用户能够在几秒钟内处理数千个转录本。该软件接受FASTA或BED格式的数据文件作为输入序列。我们还为CPAT开发了一个网络接口,允许用户提交序列并几乎即时获得预测结果。
Wang等人(周四)研究了这个问题。