Key points are not available for this paper at this time.
RÉSUMÉ Les études empiriques et de simulation sur la sélection génomique (SG) montrent des précisions suffisantes pour générer des gains génétiques rapides. Cependant, avec la popularité croissante des approches SG, de nombreux modèles ont été proposés et aucune analyse comparative n'est disponible pour identifier les plus prometteurs. À l'aide de huit ensembles de données de blé (Triticum aestivum L.), d'orge (Hordeum vulgare L.), d'Arabidopsis thaliana (L.) Heynh. et de maïs (Zea mays L.), la capacité prédictive des modèles SG actuellement disponibles ainsi que plusieurs méthodes d'apprentissage machine a été évaluée en comparant les précisions, les valeurs génomiques estimées de reproduction (GEBV) et les effets des marqueurs pour chaque modèle. Bien qu'un niveau similaire de précision ait été observé pour de nombreux modèles, le niveau de surajustement variait considérablement tout comme le temps de calcul et la distribution des estimations des effets des marqueurs. Nos comparaisons ont suggéré que SG dans les programmes d'amélioration des plantes pourrait être basé sur un ensemble réduit de modèles tels que le Lasso bayésien, la régression de shrinkage bayésienne pondérée (wBSR, une version rapide de BayesB) et les forêts aléatoires (RF) (une méthode d'apprentissage machine qui pourrait capturer des effets non-additifs). Des combinaisons linéaires de différents modèles ont été testées ainsi que des méthodes de bagging et de boosting, mais elles n'ont pas amélioré la précision. Cette étude a également montré de grandes différences de précision entre les sous-populations au sein d'un ensemble de données qui ne pouvaient pas toujours être expliquées par des différences de variance phénotypique et de taille. La grande diversité des ensembles de données empiriques testés ici ajoute des preuves que SG pourrait augmenter le gain génétique par unité de temps et de coût.
Heslot et al. (Mon,) ont étudié cette question.