Zu den wichtigsten Stoffklassen aller Organismen zählen die Proteine.
Deren vielfältige Funktionen basieren auf der spezifischen Wirkung
ihrer diversen Strukturen. Um die Prinzipien von Aufbau und Wirkung
der Proteine zu untersuchen, wurden experimentell ermittelte
Strukturen seit 1971 in der Protein Data Bank erfasst. Die Suche in dieser
Datenbank ist essentiell für die Proteinforschung. Sie ist derzeit
jedoch nur auf Basis der Sequenz oder als Textsuche in akzeptabler
Zeit möglich.
In dieser Arbeit schlagen wir eine Methode vor, die auf der
dreidimensionalen Struktur der Proteine basiert. Wir erstellen aus
diskretisierten Torsionswinkeln eine translations- und
rotationsinvariante Repräsentation der Proteine, die in einem
generalisierten Suffixbaum gespeichert wird. Mittels toleranter Suche
kann dann in diesem Baum gesucht werden. Experimente zeigen, dass der
Ansatz im Vergleich zu herkömmlichen Verfahren wesentlich schnellere
Suchen bei vergleichbarer Qualität der Ergebnisse zulässt.
«
Zu den wichtigsten Stoffklassen aller Organismen zählen die Proteine.
Deren vielfältige Funktionen basieren auf der spezifischen Wirkung
ihrer diversen Strukturen. Um die Prinzipien von Aufbau und Wirkung
der Proteine zu untersuchen, wurden experimentell ermittelte
Strukturen seit 1971 in der Protein Data Bank erfasst. Die Suche in dieser
Datenbank ist essentiell für die Proteinforschung. Sie ist derzeit
jedoch nur auf Basis der Sequenz oder als Textsuche in akzeptabler
Zeit möglich.
In...
»