This thesis demonstrates that supervised as well as unsupervised Neural Network-based approaches can learn compact descriptors for local image patches. Additionally it is shown that Explicit Negative Contrasting improves multi-view graphical models. Also, Hobbesian Networks are introduced, utilizing differential equations to induce deep models. Finally, vaeRIM combines variational inference with unsupervised clustering in a novel way.
Translated abstract:
Diese Arbeit zeigt, dass sowohl überwachte als auch unüberwachte Neuronale Netzwerkarchitekturen kompakte Repräsentationen für kleinteilige Bildausschnitte lernen können. Außerdem werden drei algorithmische Entwicklungen vorgestellt: Explicit Negative Contrasting verbessert multi-modale graphische Modelle. Hobbes'sche Netze induzieren tiefe Architekturen mittels Differentialgleichungen und vaeRIM kombiniert variationelle Inferenz mit unüberwachtem Clustering.