Sieber, Stephan A. (Prof. Dr.); Casini, Angela (Prof. Dr.); Volkamer, Andrea (Prof. Dr.)
Sprache:
en
Fachgebiet:
CHE Chemie
TU-Systematik:
CHE 600; CHE 800
Kurzfassung:
This thesis investigates modeling High Throughput Screening datasets in drug discovery via Gradient Boosting Machines for the efficient identification of bioactive molecules. New computational approaches are developed to tackle class imbalance and dataset noise. Additionally, large-scale benchmarking of Gradient Boosting Machine variants and molecular fingerprints are performed to identify best practices for modeling this class of datasets.
Übersetzte Kurzfassung:
In dieser Arbeit wird die Modellierung von Hochdurchsatz-Screening-Datensätzen in der Arzneimittelforschung mit Gradient Boosting Machines zur Identifizierung bioaktiver Moleküle untersucht. Neue Algorithmen werden entwickelt, um Klassenungleichgewicht und Rauschen in den Datensätzen zu bekämpfen. Zusätzlich wird ein Benchmarking von Gradient Boosting Machine Varianten und molekularen Fingerabdrücken durchgeführt, um die Modellierung der Datensätze zu verbessern.