Die Menge an hochaufgelösten zivilen Erdbeobachtungsbildern hat sich in den letzten 10 Jahren aufgrund zahlreicher Fortschritte bei den Bildaufnahmetechnologien in der Luft- und Raumfahrt stark erhöht und hat bereits zu einer Reihe von neuen Anwendungen geführt. Andererseits hat die große Menge an verfügbaren Bildern auch die Herausforderungen beim Durchsuchen und Verstehen ihres gesamten Inhalts (d.h. ihrer Semantik) extrem gesteigert. Daraus entstand der Bedarf nach neu zu entwickelnden Image-Mining-Systemen mit zufriedenstellender Güte und vertretbaren Rechenzeiten.
Die momentan vorhandenen Image-Mining-Systeme der Erdbeobachtung basieren in der Regel auf extrahierten Bildmerkmalen, die durch verschiedene Merkmalsdeskriptoren erzeugt werden, die entweder pixelbezogene Muster oder die Semantik von Bildern auf höherer Ebene darstellen. Daher hilft die Entwicklung von neuen Merkmalsdeskriptoren, die den Inhalt von Bildern, wie von den Nutzern erwartet, beschreiben können bei der Verbesserung der Genauigkeit und der Effizienz von Image-Mining-Systemen.
Daher stellt diese Dissertation neue Ansätze mit Latent Dirichlet Allocation (LDA) vor, einer Themenmodellierung für Merkmalsdeskriptoren auf niedriger und hoher Ebene. Weiterhin werden in der Dissertation neuartige auf LDA und auf der Informationstheorie basierende Methoden vorgeschlagen, um verschiedene Bildmerkmalsdeskriptoren unabhängig vom jeweiligen Anwendungsfall zu beurteilen. Da Nutzer ihre erhaltenen Image-Mining-Ergebnisse normalerweise aufgrund ihrer Semantik beurteilen, haben wir Nutzerstudien zur Beurteilung von Fragen wie der sensorischen oder semantischen Lücke durchgeführt, die die Nutzerakzeptanz der Ergebnisse beeinflussen. Weiterhin zeigt diese Dissertation, wie wichtig Vorwissen über die semantische Struktur von Bildern ist, um die semantische Lücke zwischen Nutzern und Rechnern zu verkleinern.
Alle zugehörigen Experimente wurden mithilfe von multispektralen und SAR-Bildern aus der Luft- und Raumfahrt durchgeführt; die Ergebnisse wurden mit Standardverfahren zur Klassifizierung und zum Clustering (z.B. mit SVM und k-Means) validiert, um kompatibel mit bereits früher erhaltenen Resultaten in unserem Fachgebiet zu sein. Die Ergebnisse demonstrieren, dass die Nutzerakzeptanz von Image-Mining-Resultaten durch die Verwendung von höheren Merkmalsdeskriptoren steigt, da die Bilder dann durch ihren semantischen Inhalt beschrieben werden. Weiterhin zeigen die Ergebnisse, dass eine vom Anwendungsfall unabhängige Bewertung der Merkmalsdeskriptoren es erlaubt, die Bewertungsergebnisse für unterschiedliche Anwendungsfälle zu verallgemeinern. Darüber hinaus weisen unsere Untersuchungen und Experimente nach, dass die sensorische als auch die semantische Lücke wegen ihrer hohen Auswirkungen auf die Nutzerakzeptanz von Image-Mining-Resultaten nicht übersehen werden sollten. Schließlich zeigen unsere Untersuchungen auch, dass eine Untersuchung des Bildmerkmalsraums das Verstehen der Bildsemantik unterstützt.
«