User: Guest  Login
Original title:
Biases Model Machine Learning Predictions in Protein Biology
Translated title:
Verzerrungen modellieren Vorhersagen durch maschinelles Lernen in der Proteinbiologie
Author:
Dallago, Christian
Year:
2023
Document type:
Dissertation
Faculty/School:
TUM School of Computation, Information and Technology
Advisor:
Rost, Burkhard (Prof. Dr.)
Referee:
Rost, Burkhard (Prof. Dr.); Wilhelm, Mathias (Prof. Dr.); Bitbol, Anne-Florence (Prof., Ph.D.)
Language:
en
Subject group:
INF Informationswesen, Bibliotheks-, Dokumentations-, Archiv-, Museumswesen
Keywords:
protein design, protein landscape prediction, protein representation learning
TUM classification:
BIO 110
Abstract:
Annotations of protein function and structure are available for far fewer protein sequences than those reported in protein sequence databases. Using little data to extrapolate blanket interpretations of biology is a delicate practice that could be tipped towards unfavorable outcomes by selecting information. This thesis is an attempt to review the state and origin of biases in protein bioinformatics.
Translated abstract:
Anmerkungen zu Funktion und Struktur von Proteinen sind für weit weniger Proteinsequenzen verfügbar als in den Proteinsequenzdatenbanken angegeben. Die Verwendung von wenigen Daten, um pauschale Interpretationen der Biologie zu extrapolieren, ist eine heikle Praxis, die durch die Auswahl von Informationen zu ungünstigen Ergebnissen geführt werden könnte. Diese Arbeit ist ein Versuch, den Stand und den Ursprung von Verzerrungen in der Protein-Bioinformatik zu überprüfen.
WWW:
https://mediatum.ub.tum.de/?id=1660280
Date of submission:
29.06.2022
Oral examination:
11.12.2023
File size:
12216001 bytes
Pages:
118
Urn (citeable URL):
https://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:91-diss-20231211-1660280-1-8
Last change:
29.10.2024
 BibTeX