Identifying high-impact variants is essential for deciphering the genetic basis of diseases. Here I created the first benchmark for expression outlier prediction in human tissues. I further developed AbExp, a method to predict aberrantly underexpressed genes from DNA sequence. Despite modest predictive ability from existing scores like CADD and LOFTEE, AbExp outperformed these 6-18 fold. Finally, I used AbExp to improve rare variant association studies and phenotype prediction in the UK Biobank.
Translated abstract:
Die Identifizierung hochwirksamer Varianten ist für die Erforschung genetischer Krankheiten unerlässlich. Hierzu entwickelte ich den ersten Benchmark für die Vorhersage von Expressionsausreißern in menschlichen Geweben. Ferner entwickelte ich AbExp, eine Methode zur Vorhersage abnormal unterexprimierter Gene, welche bestehende Scores wie CADD und LOFTEE um das 6-18fache übertraf. Zudem setzte ich AbExp zur Verbesserung von Assoziationsstudien und Vorhersage von Phänotypen in der UK Biobank ein.