Key points are not available for this paper at this time.
Cet article présente FlowCyt, le premier benchmark complet pour la classification multi-classe des cellules uniques dans les données de cytométrie en flux. Le jeu de données comprend des échantillons de moelle osseuse provenant de 30 patients, chaque cellule étant caractérisée par douze marqueurs. Les étiquettes de vérité terrain identifient cinq types de cellules hématologiques : lymphocytes T, lymphocytes B, monocytes, mastocytes et cellules souches/progénitrices hématopoïétiques (HSPCs). Les expériences utilisent l'apprentissage inductif supervisé et l'apprentissage transductif semi-supervisé sur jusqu'à 1 million de cellules par patient. Les méthodes de référence incluent les modèles de mélange gaussien, XGBoost, les forêts aléatoires, les réseaux de neurones profonds et les réseaux de neurones graphiques (GNN). Les GNN démontrent des performances supérieures en exploitant les relations spatiales dans les données encodées par des graphes. Le benchmark permet une évaluation normalisée des tâches de classification cliniquement pertinentes, ainsi que des analyses exploratoires pour obtenir des informations sur les phénotypes cellulaires hématologiques. Cela représente le premier benchmark public de cytométrie en flux avec un jeu de données richement annoté et hétérogène. Il permettra le développement et l'évaluation rigoureuse de méthodologies nouvelles pour l'analyse unicellulaire.
Bini et al. (Mer,) ont étudié cette question.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: