Key points are not available for this paper at this time.
我们推出了SequenceMatrix,这是一款旨在促进多基因数据集组装和分析的软件。通过将带有对齐序列的FASTA、NEXUS或TNT文件拖放到程序窗口中,基因得以连接。多基因数据集被连接并在表格中显示;每个序列由一个单元格表示,提供有关序列长度、插入缺失数、模糊碱基数(“Ns”)和密码子信息可用性的信息。或者,可以显示和导出序列的GenBank编号。数百个基因和分类群的矩阵可以在几分钟内连接,并以TNT、NEXUS或PHYLIP格式导出,保留TNT和NEXUS文件的字符集和密码子信息。SequenceMatrix还创建分类群集,列出具有最少字符或基因片段的分类群,帮助评估初步数据集。可以从导出中排除整个分类群、整个基因片段或特定基因和物种的单个序列。数据矩阵可以重新拆分为其组成基因,基因片段可以导出为单个基因文件。SequenceMatrix还包括两个工具,有助于识别可能因实验室污染或数据管理错误而受到影响的序列。一个工具列出基因内相同或近乎相同的序列,而另一个工具将一个基因的成对距离模式与所有剩余基因组合的模式进行比较。SequenceMatrix是基于Java的,兼容Microsoft Windows、Apple MacOS X和Linux操作系统。该软件可在http://code.google.com/p/sequencematrix/上免费下载。© Willi Hennig Society 2010.
Vaidya等人(周三)研究了这个问题。