Erkennung von Promotoren in pro- und eukaryontischen DNA-Sequenzen durch künstliche Neuronale Netze

M. Reese
Division of Molecular Biophysics
German Cancer Research Center
Im Neuenheimer Feld 280
69120 Heidelberg
Germany
M.Reese@dkfz-heidelberg.de

Abstract:

Eine spezielle Neuronale-Netzwerk-Architektur wird benutzt, um Promotoren sowohl auf prokaryontischen als auch eukaryontischen Genomen mit einer hohen Genauigkeitvorherzusagen. Diese spezielle Art Neuronaler Netze, time-delay-Neuronale Netze, berücksichtigt in den sogenannten linked receptive fields die Geometrie der gesamten Promotorregion, zum Beispiel die bekannten Signalboxen wie die "-10"-Box bei prokaryontischen Promotoren oder die "TATA"-Box bei Eukaryonten. Diese Neuronalen Netze bilden den physikalischen Bindungprozeß durch die Architektur des Netzes nach. Durch die Analyse der Gewichtsmatrizen dieser time-delay-Netze kann man sowohl wichtige Informationen über die Struktur einer Promotorregion bekommen als auch die Vorhersagegenauigkeit verbessern. Das mit den prokaryontischen Promotorsequenzen trainierte Neuronale Netz sagt alle sechs bekannten Promotoren auf dem gesamten Genom des Plasmids pBR322, die für das Netz unbekannt sind, mit einer falsch positiven Erkennungsrate von 0,15% vorher. Das mit eukaryontischen Mustersequenzen trainierte Netz erreicht auf dem strukturell komplexeren adenovirus type 2-Genom eine korrektpositive Vorhersagegenauigkeit von ebenfalls 100% bei 2,5% falsch positiver Klassifikation. Resultate auf größeren Testmengen, die mehrere positive Promotorbeispiele von DNA-Sequenzen enthalten, erzielen eine Vorhersagegenauigkeit für die pro-karyontischen Promotoren von bis zu 88% und für die eukaryontischen Promotoren von 55,12% bei einer falsch positiven Klassifikation von weniger als 1%. Die Korrelation beträgt bei Prokaryonten 0,82 sowie 0,66 bei Eukaryonten.

Back to List of Publications

Back to Martin's Corner