Benutzer: Gast  Login
Originaltitel:
Fast Structure Searching for Computational Proteomics 
Übersetzter Titel:
Schnelle Struktursuche für computer-basierte Proteomforschung 
Jahr:
2007 
Dokumenttyp:
Dissertation 
Institution:
Fakultät für Informatik 
Betreuer:
Mayr, Ernst W. (Prof. Dr.) 
Gutachter:
Brauer, Wilfried (Prof. Dr. Dr. h.c. mult.) 
Sprache:
en 
Fachgebiet:
DAT Datenverarbeitung, Informatik 
Stichworte:
protein structure, database searching, index 
Übersetzte Stichworte:
Proteinstruktur, Datenbanksuche, Index 
Kurzfassung:
Proteins are among the most important organic compounds. The vast number of their functions are based on the specific effect of their various structures. To investigate the principles of protein structure and function experimentally determined structures were collected in the Protein Data Bank since 1971. Searching in this database is essential for protein research. At the moment, the only way to perform a search in an acceptable amount of time is by sequence or as a full-text search.
In this work, we propose a search method that is based on the three-dimensional structure of proteins. From discretized torsion angles we create translation- and rotation-invariant representations which are stored in a generalized suffix tree. Queries are then performed as tolerant searches in this tree. Experiments demonstrate faster query response times while maintaining similar accuracy of search results when compared with conventional methods. 
Übersetzte Kurzfassung:
Zu den wichtigsten Stoffklassen aller Organismen zählen die Proteine. Deren vielfältige Funktionen basieren auf der spezifischen Wirkung ihrer diversen Strukturen. Um die Prinzipien von Aufbau und Wirkung der Proteine zu untersuchen, wurden experimentell ermittelte Strukturen seit 1971 in der Protein Data Bank erfasst. Die Suche in dieser Datenbank ist essentiell für die Proteinforschung. Sie ist derzeit jedoch nur auf Basis der Sequenz oder als Textsuche in akzeptabler Zeit möglich.
In dieser Arbeit schlagen wir eine Methode vor, die auf der dreidimensionalen Struktur der Proteine basiert. Wir erstellen aus diskretisierten Torsionswinkeln eine translations- und rotationsinvariante Repräsentation der Proteine, die in einem generalisierten Suffixbaum gespeichert wird. Mittels toleranter Suche kann dann in diesem Baum gesucht werden. Experimente zeigen, dass der Ansatz im Vergleich zu herkömmlichen Verfahren wesentlich schnellere Suchen bei vergleichbarer Qualität der Ergebnisse zulässt. 
Mündliche Prüfung:
27.04.2007 
Seiten:
183 
Letzte Änderung:
29.08.2007