Interpreting regulatory variants with predictive models
Übersetzter Titel:
Interpretation genregulatorischer Varianten mit prädiktiven Modellen
Autor:
Cheng, Jun
Jahr:
2019
Dokumenttyp:
Dissertation
Fakultät/School:
Fakultät für Informatik
Betreuer:
Gagneur, Julien (Prof. Dr.)
Gutachter:
Gagneur, Julien (Prof. Dr.); Theis, Fabian (Prof. Dr. Dr.)
Sprache:
en
Fachgebiet:
DAT Datenverarbeitung, Informatik
TU-Systematik:
BIO 110d
Kurzfassung:
Genetic variation affecting gene expression condition disease. Here, I developed machine learning models predicting two major steps of gene expression. First I modeled RNA stability from DNA sequence. This explains 59% of mRNA stability variation across genes. It reveals new regulatory elements and shows codon usage to be the major determinant. Second I developed MMSplice, a modular deep neural network architecture which predicts the effects of genetic variants on exon skipping, splice site choice, splicing efficiency, and pathogenicity. MMSplice won the CAGI5 exon-skipping prediction challenge 2018. These models and modeling approaches will help to pinpoint pathogenic genetic variants.
«
Genetic variation affecting gene expression condition disease. Here, I developed machine learning models predicting two major steps of gene expression. First I modeled RNA stability from DNA sequence. This explains 59% of mRNA stability variation across genes. It reveals new regulatory elements and shows codon usage to be the major determinant. Second I developed MMSplice, a modular deep neural network architecture which predicts the effects of genetic variants on exon skipping, splice site choi...
»
Übersetzte Kurzfassung:
Viele Krankenheit werden durch genetische Variation verursacht. Ich entwickelte ein Modell, welches die Variation der mRNA-Stabilität zwischen den Genen zu 59% erklärt und neue regulatorische Elemente entdeckt. Daraus hat sich ergeben, dass Codon-Usage die Variation am meisten beeinflusst. Außerdem entwickelte ich MMSplice, ein modulares Deep-Neural-Network, welches die Auswirkungen genetischer Varianten auf Splicing und Pathogenität vorhersagt. Das Modell ist Sieger des Wettbewerbs CAGI5 Exon-Skipping Prediction Challenge 2018. Diese Modelle tragen dazu bei pathogene genetische Varianten zu lokalisieren.
«
Viele Krankenheit werden durch genetische Variation verursacht. Ich entwickelte ein Modell, welches die Variation der mRNA-Stabilität zwischen den Genen zu 59% erklärt und neue regulatorische Elemente entdeckt. Daraus hat sich ergeben, dass Codon-Usage die Variation am meisten beeinflusst. Außerdem entwickelte ich MMSplice, ein modulares Deep-Neural-Network, welches die Auswirkungen genetischer Varianten auf Splicing und Pathogenität vorhersagt. Das Modell ist Sieger des Wettbewerbs CAGI5 Exon-S...
»