Les technologies de traçage de lignées basées sur CRISPR-Cas9 ont permis la reconstruction de phylogénies unicellulaires à partir de lectures transcriptionnelles. Cependant, développer des algorithmes de reconstruction d'arbres avec des garanties théoriques dans ce cadre est un défi. Dans ce travail, nous dérivons un algorithme de reconstruction avec des garanties théoriques en utilisant la méthode Neighbor-Joining (NJ) sur des distances ajustées aux moments pour estimer les vraies distances d'arbre. Nous développons une série d'outils pour analyser cet algorithme et prouver ses garanties théoriques. Lorsque les paramètres du processus de génération de données sont connus et qu'il n'y a pas de données manquantes, nos résultats s'alignent avec ceux établis à partir de modèles évolutifs communs, tels que Cavender-Farris-Neyman et Jukes-Cantor. Cependant, pour tenir compte du cas réaliste où les paramètres du processus de génération de données ne sont pas connus et qu'il y a des données manquantes, nous développons une nouvelle théorie qui montre pour la première fois qu'il est encore possible d'obtenir des garanties de reconstruction dans le cas CRISPR-Cas9 et dans d'autres modèles d'évolution. Empiriquement, nous montrons, à la fois sur des données simulées de traçage de lignées et sur des données réelles provenant d'un modèle murin de cancer du poumon, la performance améliorée de notre méthode par rapport à l'utilisation traditionnelle de la NJ.
An et al. (Thu,) ont étudié cette question.