Key points are not available for this paper at this time.
Nous présentons une approche de clustering bidirectionnelle couplée pour l'analyse des données de microarray de gènes. L'idée principale est d'identifier des sous-ensembles des gènes et des échantillons, de sorte que lorsque l'un de ceux-ci est utilisé pour regrouper l'autre, des partitions stables et significatives émergent. La recherche de tels sous-ensembles est une tâche computationnellement complexe. Nous présentons un algorithme, basé sur le clustering itératif, qui effectue une telle recherche. Cette analyse est particulièrement adaptée aux données de microarray de gènes, où les contributions d'une variété de mécanismes biologiques aux niveaux d'expression des gènes sont entremêlées dans un grand corpus de données expérimentales. La méthode a été appliquée à deux ensembles de données de microarray de gènes, sur le cancer du côlon et la leucémie. En identifiant des sous-ensembles pertinents des données et en nous concentrant sur eux, nous avons pu découvrir des partitions et des corrélations qui étaient masquées et cachées lorsque l'ensemble de données complet était utilisé dans l'analyse. Certaines de ces partitions ont une interprétation biologique claire ; d'autres peuvent servir à identifier des directions possibles pour des recherches futures.
Getz et al. (Mardi,) ont étudié cette question.