Gegenstand dieser Arbeit ist die schnelle, ansichtsbasierte Objekterkennung in Videosequenzen. Das entwickelte Verfahren verwendet als implizites Modell eines Objekts nur Aufnahmen des Objekts und Aufnahmen der typischen Objektumgebung als Zurückweisungsklasse. Mittels eines binären Entscheidungsbaumes werden diese Ansichten für die Erkennung des Objekts mit Kamerabildern verglichen. Zu diesem Zweck wird in kleinen Schritten ein Suchfenster über das Kamerabild geschoben und nach jeder Verschiebung festgestellt, ob der Inhalt des Suchfensters einer Ansicht des Objekts oder einer Ansicht der Zurückweisungsklasse ähnlicher ist. Das Ergebnis einer solchen Klassifikation ist die Information, zu welcher Klasse der Bildausschnitt gehört. Diese Information läßt sich mathematisch exakt erfassen und dient als Gütekriterium für die optimale Dimensionierung des Klassifikators. Diese Auslegung führt zu einer Verkleinerung der Entscheidungsbäume, und damit zu einer schnellen und robusten Erkennung. Für die Geschwindigkeitssteigerung des gesamten Erkennerverfahrens wurden zusätzlich noch zwei unterschiedliche Verfahren zur effizienten Vor-Auswahl von Information entwickelt, die eine Objekterkennung in Echtzeit erlauben. Dadurch kann das Verfahren auch für die Objekterkennung und -verfolgung in einer Videosequenz eingesetzt werden. Eine Fortschreibung und Prädiktion der Objekttrajektorie in einer Videosequenz wird durch eine Hypothesenfortschreibung ermöglicht; die hohe Dynamik des Erkenners ermöglicht damit auch den Einsatz des Erkenners in geschlossenen Regelkreisen. Die Praxistauglichkeit, insbesondere die Robustheit der entwickelten Verfahren wird beispielhaft mit einer prototypischen Implementierung für den mobilen Serviceroboter ROMAN und einer schnellen Gesichtsdetektion nachgewiesen.
«
Gegenstand dieser Arbeit ist die schnelle, ansichtsbasierte Objekterkennung in Videosequenzen. Das entwickelte Verfahren verwendet als implizites Modell eines Objekts nur Aufnahmen des Objekts und Aufnahmen der typischen Objektumgebung als Zurückweisungsklasse. Mittels eines binären Entscheidungsbaumes werden diese Ansichten für die Erkennung des Objekts mit Kamerabildern verglichen. Zu diesem Zweck wird in kleinen Schritten ein Suchfenster über das Kamerabild geschoben und nach jeder Verschiebu...
»
Übersetzte Kurzfassung:
This thesis describes a method for fast, appearance-based object recognition within a videostream. The model for object recognition consists only of images of the object and images of the typical object environment as rejection class. For purposes of object recognition a small search window is shifted over the camera image and after each shift the content of the window is compared with the model of the object and the rejection class. This comparision is done with a binary decision tree. The classification result being the information on the class can be calculated exactly and serves as objective function for the optimization of the classifier. This approach leads to small and therefore robust and fast decision trees. In addition two undersampling methods have been integrated into the algorithm for efficent pre-selecting of appropriate information. They make object recognition in real-time possible. This enables fast object tracking and object trajectory following as well as a prediction of the objects movement for high dynamic closed-loop applications. The object recognition system has been applied on the mobile service-robot ROMAN as part of an intelligent module for object grasping. The experiments demonstrate the robustness and the real-time capability of the proposed algorithm. Furthermore fast face recognition has been performed and shows the wide variety of objects being able to be recognised.
«
This thesis describes a method for fast, appearance-based object recognition within a videostream. The model for object recognition consists only of images of the object and images of the typical object environment as rejection class. For purposes of object recognition a small search window is shifted over the camera image and after each shift the content of the window is compared with the model of the object and the rejection class. This comparision is done with a binary decision tree. The clas...
»