在人类遗传学中,一个长期目标是优先考虑那些当被破坏时会导致发育障碍和其他孟德尔性状的非编码位点。为了实现这一目标,开发了多种指标来区分中性进化序列与那些受到净化选择的序列。这些指标通常在整个基因组范围内进行评估,例如,通过计算覆盖整个非编码基因组的窗口的精确回忆曲线。在这里,我们识别出这些指标相对于其基因组表现显著低于其表现的非编码基因组部分,这主要是由于中性遗传变异模型的“偏差”和/或遗传数据中的低“信号噪声比”。对于Gnocchi(Chen et al. 2024),其性能随着GC含量的增加而下降,表现出最极端的影响。我们建议使用相应模型偏差的稳健度量来注释非编码基因组区间的约束分数,这样可以让用户评估对这些分数的信心。
McHale等人(周三)研究了这个问题。