Key points are not available for this paper at this time.
个体在一组单核苷酸多态性(SNPs)上的基因型可以用来预测该个体的族裔或祖先。在医学研究中,了解受试者的祖先可以最小化可能的混杂因素,而在法医应用中,这种知识可以帮助指导调查。我们的目标是选择一小部分来自人类基因组中已识别的数百万个SNP,这些SNP能够以最低的错误率预测祖先。该变量选择程序的一般形式是使用训练数据集估计SNP集合的期望错误率,并考虑在给定大小时错误率最低的集合。错误率估计的质量决定了结果SNP的质量。当SNP数量或种群数量较大时,明显错误率表现较差;我们提出了一种新的估计方法,改进的贝叶斯估计。我们证明了基于该估计的选择程序生成的小型SNP集合能准确预测祖先。我们还提供了一份识别祖先的100个最佳SNP列表。
Sampson等人(周二)研究了这个问题。
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: