Key points are not available for this paper at this time.
Die Entwicklung der Genomsequenzierung und der DNA-Microarray-Analyse der Genexpression führt zu einer Nachfrage nach Data-Mining-Tools. BioProspector, ein C-Programm, das eine Gibbs-Sampling-Strategie verwendet, untersucht die upstream-Region von Genen in derselben Gruppe mit Genexpressionsmustern und sucht nach regulatorischen Sequenzmotiven. BioProspector verwendet Null bis dritter Ordnung Markov-Hintergrundmodelle, deren Parameter entweder vom Benutzer angegeben oder aus einer bestimmten Sequenzdatei geschätzt werden. Die Bedeutung jedes gefundenen Motivs wird basierend auf einer geschätzten Motivpunktwertverteilung durch eine Monte-Carlo-Methode beurteilt. Darüber hinaus modifiziert BioProspector das Motiva-Modell, das in den früheren Gibbs-Samplern verwendet wurde, um die Modellierung von Gaps und Motiven mit palindromischen Mustern zu ermöglichen. All diese Modifikationen verbessern die Leistung des Programms erheblich. Obwohl Test und Entwicklung noch in Arbeit sind, hat das Programm erste Erfolge bei der Auffindung der Bindungsmotive für Saccharomyces cerevisiae RAP1, Bacillus subtilis RNA-Polymerase und Escherichia coli CRP gezeigt. Wir arbeiten derzeit daran, BioProspector mit einem Clusterprogramm zu kombinieren, um Genexpressionsnetzwerke und regulatorische Mechanismen zu erkunden.
Liu et al. (Fri,) haben diese Frage untersucht.