Selected Communications Theoretic Aspects in Genetics
Translated title:
Ausgewählte Anwendungen der Kommunikations- und Informationstheorie in der Genetik
Author:
Hanus, Pavol
Year:
2010
Document type:
Dissertation
Faculty/School:
Fakultät für Elektrotechnik und Informationstechnik
Advisor:
Hagenauer, Joachim (Prof. Dr. Dr. E.h.)
Referee:
Bossert, Martin (Prof. Dr.)
Language:
en
Subject group:
BIO Biowissenschaften; DAT Datenverarbeitung, Informatik; ELT Elektrotechnik
Keywords:
communication engineering, information theory, genetics, molecular biology, sequence alignment, compression, synchronization, marker, binding site analysis
This thesis covers novel applications of concepts from communications engineering to problems in molecular biology. In the first part the focus is placed on applying source coding techniques to reduce the storage requirement of multiple genome alignment datasets used in comparative genomics. A highly efficient lossless compression algorithm using well established models of genome evolution and binary image compression techniques is introduced. The second part studies parallels between sequence specific protein binding on the molecular level and threshold based marker synchronization over noisy channels. The engineering concept of threshold based marker synchronization over noisy channels is revised and extended. Binding site models and in silico inference techniques are reviewed using information theory. Synchronization properties of molecular markers are analysed and evidence for selection pressure towards good markers is found.
«
This thesis covers novel applications of concepts from communications engineering to problems in molecular biology. In the first part the focus is placed on applying source coding techniques to reduce the storage requirement of multiple genome alignment datasets used in comparative genomics. A highly efficient lossless compression algorithm using well established models of genome evolution and binary image compression techniques is introduced. The second part studies parallels between sequence s...
»
Translated abstract:
Es werden neue Anwendungen der Kommunikations- und Informationstheorie auf Probleme in der molekularen Biologie behandelt. Im ersten Teil wird Quellencodierung genutzt um die Speicheranforderungen von genomweiten Sequenzalignment Datensätzen zu verringern. Ein hocheffizienter Kompressionsalgorithmus basierend auf statistischen Modellen der Evolution und Techniken aus der binären Bildcodierung wird vorgeschlagen. Im zweiten Teil werden die Parallelen zwischen der Marker Synchronisation über verrauschte Kanäle und der Protein-DNA Bindungsstellensuche studiert. Statistische Bindungsstellen Modelle und Inferenztechniken werden aus informationstheoretischer Sicht analysiert und erweitert. Synchronisationseigenschaften von ausgewählten molekularen Markern werden evaluiert und Evidenz für Selektionsdruck zugunsten effizienter Marker gefunden.
«
Es werden neue Anwendungen der Kommunikations- und Informationstheorie auf Probleme in der molekularen Biologie behandelt. Im ersten Teil wird Quellencodierung genutzt um die Speicheranforderungen von genomweiten Sequenzalignment Datensätzen zu verringern. Ein hocheffizienter Kompressionsalgorithmus basierend auf statistischen Modellen der Evolution und Techniken aus der binären Bildcodierung wird vorgeschlagen. Im zweiten Teil werden die Parallelen zwischen der Marker Synchronisation über verra...
»