Etablierung und Anwendung der Exom-Sequenzierung und eines NGS-LIMS zur Identifikation seltener pathogener genetischer Varianten bei monogenen Erkrankungen
Übersetzter Titel:
Development and application of exome sequencing and a NGS LIMS for the identification of causal variants in monogenic diseases
Autor:
Graf, Elisabeth
Jahr:
2019
Dokumenttyp:
Dissertation
Fakultät/School:
Fakultät Wissenschaftszentrum Weihenstephan
Betreuer:
Fries, Hans-Rudolf (Prof. Dr.)
Gutachter:
Fries, Hans-Rudolf (Prof. Dr.); Meitinger, Thomas (Prof. Dr.)
exome sequencing, next-generation sequencing, LIMS, laboratory information and management system, Automation, Parkinson's disease, Burn-McKeown syndrome, FFPE
TU-Systematik:
LAN 610d
Kurzfassung:
Die Identifizierung genetischer Veränderungen als Ursache humaner Erkrankungen hat eine herausragende Stellung in der Medizin. Sie ist die Grundlage zum Verständnis der Entstehung von Krankheiten und bildet die Basis zur Entwicklung neuer therapeutischer Ansätze. Die bisherigen molekulargenetischen Untersuchungsmethoden, wie Kandidatengenanalysen und Kopplungsanalysen sind häufig zeit- und kostenintensiv. Die im Jahr 2005 eingeführten Sequenziertechniken der zweiten Generation hingegen bieten die Möglichkeit, gesamte Genome, Exome und Transkriptome in vergleichsweise kurzer Zeit und bei stetig fallenden Kosten zu analysieren. Die Hochdurchsatzsequenzierung erlangte in der letzten Dekade enorme Popularität und ist eine bahnbrechende Methodik zur direkten Identifizierung pathogener Genvarianten. Der Fokus der derzeitigen Forschung liegt dabei auf der Untersuchung der kodierenden genetischen Sequenz, dem Exom, als günstige und gleichzeitig erfolgversprechendste Anwendung. Die vorliegende Arbeit beschreibt die Einführung einer automatisierten Exom-Library-Präparation, sowie die Einführung von Qualitätssicherung und Standardisierungen innerhalb der Laborprozesse. Der steigende Probendurchsatz machte die Handhabung von Probeneingängen, Probenbearbeitungen sowie der Ergebnisdarstellung sehr komplex. Als Anwendung zur Unterstützung administrativer Aufgaben der Probenbearbeitung beschreibt die vorliegende Arbeit die Entwicklung eines Labor-Informations- und Management-Systems (LIMS), welches zum Beginn der Exom-Sequenzierung am Institut für Humangenetik für den Bereich der Next-Generation-Sequenzierung nicht zur Verfügung stand. Die web-basierte Anwendung unterstützt die Laborarbeit auf den Ebenen des Probeneingangs, der Probenbearbeitung und der Qualitätskontrolle im Hochdurchsatz. Das LIMS wurde weiterhin durch die Einführung eines Sample Manifests für den Probeneingang, eines Sample Tracking Sheets für die Probenprozessierung, eines 2D-Barcode-Systems sowie einer Kontaminationsanalyse in seiner Funktionsweise erweitert und verfeinert. Die Evolution der Laborfertigkeiten und des LIMS führte zu einer erfolgreichen Anwendung der NG-Sequenzierung am Institut für Humangenetik. Die Automation wurde genutzt, um ein Protokoll für die Library-Präparation von FFPE-DNA zu entwickeln und daraus abgeleitet, Kriterien an das Ausgangsmaterial für eine erfolgreiche Sequenzierung zu definieren. Die Semi-Automation und das LIMS wurde erstmals im Jahr 2011 zur Erkennung von kausativen Varianten bei monogenen Erkrankungen eingesetzt. Seither folgten weitere Studien und die Exom- und Genom-Sequenzierung entwickelte sich zu einer Routineanwendung. In der vorliegenden Arbeit werden exemplarisch zwei Studien vorgestellt. In der ersten Studie aus dem Jahr 2011 wurde durch eine Exom-Sequenzierung die ursächliche genetische Variante c.1858G>A, p.Asp620Asn im Gen VPS35 bei drei Familien mit Morbus Parkinson identifiziert. In einer zweiten Studie aus dem Jahr 2014 werden die Grenzen der Exom-Sequenzierung aufgezeigt. Genetische Varianten, die außerhalb der kodierenden Bereiche liegen, können mit der Exom-Sequenzierung nicht erkannt werden. So konnten nur durch eine Kombination aus Exom- und Genom-Sequenzierung bei Patienten mit Burn-McKeown-Syndrom biallele Mutationen im Gen TXNL4A als ursächlich für die Erkrankung identifiziert werden. Die Ergebnisse zeigen, dass das Burn-McKeown-Syndrom eine autosomal-rezessive Erkrankung ist, die primär durch compound-heterozygote Promotordeletionen in Kombination mit sehr seltenen loss-of-function Mutationen in TXNL4A hervorgerufen wird.
Übersetzte Kurzfassung:
The identification of genetic variation as the cause of human disease plays a pivotal role in medicine. It drives our understanding of disease etiology and development of new therapeutic agents. Traditional molecular genetic methods such as candidate gene analysis or linkage analysis tend to be time-consuming and expensive. However, the second generation sequencing technologies introduced in 2005 offer the possibility to analyze whole genomes, exomes and transcriptomes fast and less costly. High-throughput sequencing gained enormous popularity during the last decade and is a pioneering method for the direct identification of pathogenic genetic variations. Current research focuses on the investigation of the coding sequence, the exome, as a cost-effective and at the same time most promising application. This thesis encompasses the implementation of an automated exome library preparation, as well as the introduction of quality assurance and standardization within the laboratory processes. The increasing sample throughput complicated management of sample entries, sample processing as well as data analysis and presentation of results. Therefore, using simple Excel tables for documentation and information transfer did not suffice any more. This thesis describes the development of a next-generation sequencing laboratory information and management system (LIMS) to support administrative tasks in sample processing, which was not available when exome sequencing started at the Institute of Human Genetics. The web-based application supports laboratory work at the levels of sample receipt, sample processing and high-throughput quality control . The basic LIMS functionality was expanded by the introduction of a sample manifest for the sample submission, a sample tracking sheet for sample processing, a 2D barcode system and an analysis workflow for detecting contamination. The advancement of laboratory skills and the LIMS enabled the successful application of next-generation sequencing at the Institute of Human Genetics. The automation platform was used to develop a library preparation protocol for FFPE DNA and to define quality criteria for starting material in order to achieve successful library preparation and high sequencing data quality. In 2011, both semi-automation and LIMS were used for the first time to detect causal variants in monogenic diseases. Since then, other studies ensued at the Institute of Human Genetics and exome and genome sequencing developed into a routine application. This work presents two studies as examples of successful gene identification with exome sequencing. In the first study from 2011, the causal genetic variant c.1858G>A, p. Asp620Asn in the gene VPS35 was identified by exome sequencing in three families with Parkinson’s disease. A second study from 2014 serves to show the limitations of exome sequencing. The vast majority of genetic variants located in non-coding regions is not detected with exome sequencing. Thus, the causative biallelic TXNL4A variant in patients with Burn-McKeown syndrome could only be identified by a combination of exome and genome sequencing. The results show that the Burn-McKeown syndrome is an autosomal-recessive disease primarily caused by compound-heterozygous combinations of promotor deletions and very rare loss of function mutations in the TXNL4A gene.