Das Auftreten neuer experimenteller Methoden führte in den letzten Jahren zu einer drastischen Zunahme verfügbarer, biologischer Daten geführt. Um aus dieser Datenmenge wissenschaftlich relevante Ergebnisse abzuleiten, wird es daher immer wichtiger geeignete mathematische und rechnergestützte Methoden zu finden. Eine der größten Herausforderungen im Bereich der Biomathematik und Biostatistik ist es daher, bestehende Methoden an die oft sehr spezifischen Eigenschaften der Daten anzupassen und zusätzlich neue Methoden für die Modellierung dieser Daten zu finden.
In dieser Arbeit werden Methoden aus der Statistik und dem maschinellen Lernen vorgestellt, die dieser Aufgabe gerecht werden. Dabei wird die Entwicklung neuer mathematischer Methoden stets mit dem Versuch verknüpft, wissenschaftliche Einblicke in das untersuchte biologische System zu gewinnen. Der biologische Fokus dieser Arbeit liegt auf der Analyse von Heterogenität zwischen Zellen: die Zellen eines lebenden Organismus besitzen fast alle die gleiche DNA, dennoch findet man eine Vielfalt an verschiedenen Zelltypen vor, die jeweils andere Aufgaben im Organismus erfüllen. Ziel dieser Arbeit ist es, mit mathematischen Methoden sowohl die Ursachen dieser Heterogenität zu analysieren, als auch die Identifizierung von verschiedenen Zellzustände zu verbessern.
Dazu werden vier verschiedene mathematische Methoden implementiert, getestet und auf biologische Daten angewandt, um so neue Rückschlüsse über das Auftreten von Heterogenität von Zellen ziehen zu können:
(i) Es wird eine statistische Methode vorgestellt mit der bei Einzelzell-Transcriptomics Daten auftretende latente Störfaktoren korrigiert werden können, welche durch Unterschiede in der Zellgröße zustande kommen und welche die Inferenz des zugrunde liegenden Genexpressionsmechanismus beeinflussen.
(ii) Durch das Anwenden von Modellen basierend auf gewöhnlichen Differentialgleichungen auf Chromatindaten wird gezeigt dass Histonacetylierungen (eine spezielle Klasse von Chromatinmodifikationen, die für die Regulation der Genexpression von Bedeutung sind) spezifisch vom Zustand des Chromatins vor Eintreten der Modifizierung abhängen.
(iii) Mit Hilfe der Transferentropie werden zeitaufgelöste Proteindaten von hämatopoetischen Stamm- und Vorläuferzellen untersucht und wird festgestellt, dass sich der Informationsfluss zwischen zwei wichtigen Transkriptionsfaktoren abhängig vom finalen Phänotypen der Zellen unterscheidet.
(iv) Durch die Anwendung von Methoden aus dem Bereich des maschinellen Lernens wird gezeigt, dass verschiedene Zellphänotypen ohne zusätzliche chemische Farbstoffe klassifiziert werden können.
Mit Blick auf die Zukunft kann davon ausgegangen werden, dass die Rolle der Biomathematik für die Erforschung der zahlreichen biologischen Prozesse, die letztlich zu Heterogenität zwischen Zellen führen, immer wichtiger werden wird.
«
Das Auftreten neuer experimenteller Methoden führte in den letzten Jahren zu einer drastischen Zunahme verfügbarer, biologischer Daten geführt. Um aus dieser Datenmenge wissenschaftlich relevante Ergebnisse abzuleiten, wird es daher immer wichtiger geeignete mathematische und rechnergestützte Methoden zu finden. Eine der größten Herausforderungen im Bereich der Biomathematik und Biostatistik ist es daher, bestehende Methoden an die oft sehr spezifischen Eigenschaften der Daten anzupassen und zus...
»