Interpreting regulatory variants with predictive models
Translated title:
Interpretation genregulatorischer Varianten mit prädiktiven Modellen
Author:
Cheng, Jun
Year:
2019
Document type:
Dissertation
Faculty/School:
Fakultät für Informatik
Advisor:
Gagneur, Julien (Prof. Dr.)
Referee:
Gagneur, Julien (Prof. Dr.); Theis, Fabian (Prof. Dr. Dr.)
Language:
en
Subject group:
DAT Datenverarbeitung, Informatik
TUM classification:
BIO 110d
Abstract:
Genetic variation affecting gene expression condition disease. Here, I developed machine learning models predicting two major steps of gene expression. First I modeled RNA stability from DNA sequence. This explains 59% of mRNA stability variation across genes. It reveals new regulatory elements and shows codon usage to be the major determinant. Second I developed MMSplice, a modular deep neural network architecture which predicts the effects of genetic variants on exon skipping, splice site choice, splicing efficiency, and pathogenicity. MMSplice won the CAGI5 exon-skipping prediction challenge 2018. These models and modeling approaches will help to pinpoint pathogenic genetic variants.
«
Genetic variation affecting gene expression condition disease. Here, I developed machine learning models predicting two major steps of gene expression. First I modeled RNA stability from DNA sequence. This explains 59% of mRNA stability variation across genes. It reveals new regulatory elements and shows codon usage to be the major determinant. Second I developed MMSplice, a modular deep neural network architecture which predicts the effects of genetic variants on exon skipping, splice site choi...
»
Translated abstract:
Viele Krankenheit werden durch genetische Variation verursacht. Ich entwickelte ein Modell, welches die Variation der mRNA-Stabilität zwischen den Genen zu 59% erklärt und neue regulatorische Elemente entdeckt. Daraus hat sich ergeben, dass Codon-Usage die Variation am meisten beeinflusst. Außerdem entwickelte ich MMSplice, ein modulares Deep-Neural-Network, welches die Auswirkungen genetischer Varianten auf Splicing und Pathogenität vorhersagt. Das Modell ist Sieger des Wettbewerbs CAGI5 Exon-Skipping Prediction Challenge 2018. Diese Modelle tragen dazu bei pathogene genetische Varianten zu lokalisieren.
«
Viele Krankenheit werden durch genetische Variation verursacht. Ich entwickelte ein Modell, welches die Variation der mRNA-Stabilität zwischen den Genen zu 59% erklärt und neue regulatorische Elemente entdeckt. Daraus hat sich ergeben, dass Codon-Usage die Variation am meisten beeinflusst. Außerdem entwickelte ich MMSplice, ein modulares Deep-Neural-Network, welches die Auswirkungen genetischer Varianten auf Splicing und Pathogenität vorhersagt. Das Modell ist Sieger des Wettbewerbs CAGI5 Exon-S...
»