Key points are not available for this paper at this time.
À mesure que la densité des marqueurs moléculaires augmente, il y a un besoin pressant tant dans les études d'association à l'échelle du génome que dans la sélection génomique d'ajuster des modèles avec un grand nombre de paramètres. Ici, nous présentons un algorithme de régression ridge généralisée (RR) computationnellement efficace pour les situations dans lesquelles le nombre de paramètres dépasse largement le nombre d'observations. Les parties computationnellement exigeantes de la méthode dépendent principalement du nombre d'observations et non du nombre de paramètres. L'algorithme a été implémenté dans le package R bigRR basé sur le package précédemment développé hglm. En utilisant une telle approche, un modèle d'effets hétéroscédastiques (HEM) a également été développé, implémenté et testé. L'efficacité pour différentes tailles de données a été évaluée par simulation. La méthode a été testée pour un trait bactério-hypersensible dans un ensemble de données d'Arabidopsis disponible publiquement comprenant 84 lignées pures et 216 130 SNPs. Le calcul de tous les effets SNP a nécessité <10 sec en utilisant un seul cœur de 2,7 GHz. L'avantage en temps d'exécution rend le test de permutation faisable pour un tel modèle de génome entier, de sorte qu'un seuil de signification à l'échelle du génome puisse être obtenu. Le HEM s'est avéré plus robuste que le RR ordinaire (également appelé SNP-meilleure prédiction linéaire sans biais) en termes de cartographie de QTL, car une réduction spécifique au SNP a été appliquée au lieu d'une réduction commune. L'algorithme proposé a également été évalué pour l'évaluation génomique et a montré de meilleures prédictions que le RR ordinaire.
Shen et al. (Samedi) ont étudié cette question.