Erkennung von Promotoren in pro- und eukaryontischen
DNA-Sequenzen durch künstliche Neuronale Netze
M. Reese
Division of Molecular Biophysics
German Cancer Research Center
Im Neuenheimer Feld 280
69120 Heidelberg
Germany
M.Reese@dkfz-heidelberg.de
Abstract:
Eine spezielle Neuronale-Netzwerk-Architektur wird benutzt, um Promotoren sowohl
auf prokaryontischen als auch eukaryontischen Genomen mit
einer hohen Genauigkeitvorherzusagen. Diese spezielle Art Neuronaler
Netze, time-delay-Neuronale Netze, berücksichtigt in den
sogenannten linked receptive fields die Geometrie der gesamten
Promotorregion, zum Beispiel die bekannten Signalboxen wie die
"-10"-Box bei prokaryontischen Promotoren oder die "TATA"-Box
bei Eukaryonten. Diese Neuronalen Netze bilden den physikalischen
Bindungprozeß durch die Architektur des Netzes nach. Durch
die Analyse der Gewichtsmatrizen dieser time-delay-Netze kann
man sowohl wichtige Informationen über die Struktur einer
Promotorregion bekommen als auch die Vorhersagegenauigkeit verbessern.
Das mit den prokaryontischen Promotorsequenzen trainierte Neuronale
Netz sagt alle sechs bekannten Promotoren auf dem
gesamten Genom des Plasmids pBR322, die für
das Netz unbekannt sind, mit einer falsch positiven
Erkennungsrate von 0,15% vorher. Das mit eukaryontischen
Mustersequenzen trainierte Netz erreicht auf dem strukturell komplexeren
adenovirus type 2-Genom eine korrektpositive Vorhersagegenauigkeit
von ebenfalls 100% bei 2,5% falsch positiver Klassifikation.
Resultate auf größeren Testmengen, die mehrere positive
Promotorbeispiele von DNA-Sequenzen enthalten, erzielen eine
Vorhersagegenauigkeit für
die pro-karyontischen Promotoren von bis zu 88%
und für die eukaryontischen Promotoren von 55,12% bei
einer falsch positiven Klassifikation von weniger als
1%. Die Korrelation beträgt bei Prokaryonten 0,82 sowie 0,66 bei Eukaryonten.
Back to List of Publications
Back to Martin's Corner