Sieber, Stephan A. (Prof. Dr.); Casini, Angela (Prof. Dr.); Volkamer, Andrea (Prof. Dr.)
Language:
en
Subject group:
CHE Chemie
TUM classification:
CHE 600; CHE 800
Abstract:
This thesis investigates modeling High Throughput Screening datasets in drug discovery via Gradient Boosting Machines for the efficient identification of bioactive molecules. New computational approaches are developed to tackle class imbalance and dataset noise. Additionally, large-scale benchmarking of Gradient Boosting Machine variants and molecular fingerprints are performed to identify best practices for modeling this class of datasets.
Translated abstract:
In dieser Arbeit wird die Modellierung von Hochdurchsatz-Screening-Datensätzen in der Arzneimittelforschung mit Gradient Boosting Machines zur Identifizierung bioaktiver Moleküle untersucht. Neue Algorithmen werden entwickelt, um Klassenungleichgewicht und Rauschen in den Datensätzen zu bekämpfen. Zusätzlich wird ein Benchmarking von Gradient Boosting Machine Varianten und molekularen Fingerabdrücken durchgeführt, um die Modellierung der Datensätze zu verbessern.