Metabolomics, die Erforschung metabolischer Profile auf globalem Level, hat sich als ein bewährtes Hilfsmittel etabliert, um Einblicke in die patho-physiologischen Ausprägungen eines Organismus zu erlangen. Im Gegensatz zu anderen omics-Daten sind metabolische Messungen von jeder Art Probe informativ, da Metaboliten klein sind und daher schnell in den gesamten Körper diffundieren. Das hat insbesondere klinische Vorteile, da Metabolomics-Messungen aus leicht zugänglichen Körperflüssigkeiten wie Blut und Urin viel Auskunft über den Organismus geben.
Die meisten veröffentlichten Humanstudien im Metabolomics-Bereich basieren auf Messungen innerhalb nur einer Körperflüssigkeit, üblicherweise Blut. Ein schnell um sich greifender Trend, der durch jüngste technische Fortschritte ermöglicht wird, ist die Messung und Analyse von sogenannten multi-fluid-Daten – Messungen aus unterschiedlichen Körperflüssigkeiten derselben Person. Diese Daten erlauben, nicht nur lokale, sondern auch organübergreifende metabolische Prozesse sowie deren Verknüpfungen zu klinischen Endpunkten zu untersuchen. Um das volle Potenzial dieser komplexen multi-fluid-Daten auszuschöpfen, ist die Entwicklung neuer, geeigneter statistischer Ansätze von Nöten. Das Ziel dieser kumulativen Dissertation war es in diesem Zusammenhang, geeignete Methoden zum Preprocessing, zur Datenanalyse und zur Dateninterpretation von Metabolomics-Studien beizusteuern. In drei Hauptprojekten wurde jeweils einer dieser Aspekte behandelt.
Untargeted MS-basierte Metabolomics-Daten beinhalten typischerweise eine enorme Anzahl an missing values – fehlende Einträge in der Datenmatrix. Wir analysierten das Auftreten und die Systematik von missing values in echten Daten, um die daraus abgeleiteten Erkenntnisse in die Evaluierung von möglichen Handhabungsstrategien einfließen zu lassen. Mit dieser Studie konnte erstmalig eine ausführliche Beschreibung von missing values-Eigenschaften und -Empfehlungen für die beste Umgangsstrategie geliefert werden.
Der Fokus des zweiten Hauptprojekts lag auf der netzwerkbasierten Analyse von komplexen multi-fluid-Daten, um metabolische Prozesse innerhalb und zwischen unterschiedlichen Körperflüssigkeiten statistisch zu rekonstruieren. Zusätzlich haben wir einen Ansatz zur Analyse phänotypischer Outcomes im Zusammenhang mit den rekonstruierten metabolischen Prozessen vorgestellt. Der generische Charakter und das Potenzial unserer Methoden wurde erfolgreich in weiteren Follow-up-Studien unter Beweis gestellt.
Schließlich zielten wir in einer dritten Studie darauf ab, die Interpretation von komplexen Assoziationen zwischen phänotypischem Outcome und hochdimensionalen Daten zu erleichtern. Metabolische Einheiten bilden typischerweise funktionale Module, die mit dem Phänotypen assoziiert sind. Diese Assoziationen können in der Netzwerkdarstellung sowohl in zerstreuter („sparse effects“) als auch dichter Form („dense effects“) auftreten. Um beide Fälle angemessen interpretieren zu können, bestand unser Ansatz darin, funktionale Module auf unterschiedlichem Auflösungs-Level (von Metaboliten-Level über Pathway-Level) zu untersuchen. Während sparse Assoziationen auf Metaboliten-Level gut interpretierbar sind, sind dense Assoziationen auf Pathway-Level übersichtlicher und einfacher auszuwerten. Wir entwickelten eine netzwerkbasierte Methode, die systematisch funktionale Module auf unterschiedlichen Levels sucht. Entsprechend dem gegenwärtigen, wichtigen Trend, neue generische Algorithmen für die wissenschaftliche Gemeinschaft zugänglich zu machen, haben wir unseren Ansatz als kostenfreies R package implementiert.
Zusammenfassend ist festzuhalten, dass wir einerseits bereits existierende Methoden umfassend evaluiert und andererseits neue Ansätze entwickelt haben, die im Metabolomics- Bereich massiv dazu beitragen werden, ein adäquates Datenpreprocessing und eine statistisch starke Datenanalyse sicherzustellen. Durch anschauliche Visualisierungsmethoden und innovative Betrachtungsweisen wird die Dateninterpretation erheblich vereinfacht. Die Erkenntnisse, die im Rahmen dieser Dissertation erarbeitet wurden, werden dazu beitragen, in künftigen Metabolomics-Studien das volle Potenzial von komplexen multi-fluid-Daten zu erkennen und auszuschöpfen.
«
Metabolomics, die Erforschung metabolischer Profile auf globalem Level, hat sich als ein bewährtes Hilfsmittel etabliert, um Einblicke in die patho-physiologischen Ausprägungen eines Organismus zu erlangen. Im Gegensatz zu anderen omics-Daten sind metabolische Messungen von jeder Art Probe informativ, da Metaboliten klein sind und daher schnell in den gesamten Körper diffundieren. Das hat insbesondere klinische Vorteile, da Metabolomics-Messungen aus leicht zugänglichen Körperflüssigkeiten wie B...
»