User: Guest  Login
Original title:
Fast Structure Searching for Computational Proteomics 
Translated title:
Schnelle Struktursuche für computer-basierte Proteomforschung 
Year:
2007 
Document type:
Dissertation 
Institution:
Fakultät für Informatik 
Advisor:
Mayr, Ernst W. (Prof. Dr.) 
Referee:
Brauer, Wilfried (Prof. Dr. Dr. h.c. mult.) 
Language:
en 
Subject group:
DAT Datenverarbeitung, Informatik 
Keywords:
protein structure, database searching, index 
Translated keywords:
Proteinstruktur, Datenbanksuche, Index 
Abstract:
Proteins are among the most important organic compounds. The vast number of their functions are based on the specific effect of their various structures. To investigate the principles of protein structure and function experimentally determined structures were collected in the Protein Data Bank since 1971. Searching in this database is essential for protein research. At the moment, the only way to perform a search in an acceptable amount of time is by sequence or as a full-text search.
In this work, we propose a search method that is based on the three-dimensional structure of proteins. From discretized torsion angles we create translation- and rotation-invariant representations which are stored in a generalized suffix tree. Queries are then performed as tolerant searches in this tree. Experiments demonstrate faster query response times while maintaining similar accuracy of search results when compared with conventional methods. 
Translated abstract:
Zu den wichtigsten Stoffklassen aller Organismen zählen die Proteine. Deren vielfältige Funktionen basieren auf der spezifischen Wirkung ihrer diversen Strukturen. Um die Prinzipien von Aufbau und Wirkung der Proteine zu untersuchen, wurden experimentell ermittelte Strukturen seit 1971 in der Protein Data Bank erfasst. Die Suche in dieser Datenbank ist essentiell für die Proteinforschung. Sie ist derzeit jedoch nur auf Basis der Sequenz oder als Textsuche in akzeptabler Zeit möglich.
In dieser Arbeit schlagen wir eine Methode vor, die auf der dreidimensionalen Struktur der Proteine basiert. Wir erstellen aus diskretisierten Torsionswinkeln eine translations- und rotationsinvariante Repräsentation der Proteine, die in einem generalisierten Suffixbaum gespeichert wird. Mittels toleranter Suche kann dann in diesem Baum gesucht werden. Experimente zeigen, dass der Ansatz im Vergleich zu herkömmlichen Verfahren wesentlich schnellere Suchen bei vergleichbarer Qualität der Ergebnisse zulässt. 
Oral examination:
27.04.2007 
Pages:
183 
Last change:
29.08.2007