Gegenstand dieser Arbeit ist die schnelle, ansichtsbasierte Objekterkennung in Videosequenzen. Das entwickelte Verfahren verwendet als implizites Modell eines Objekts nur Aufnahmen des Objekts und Aufnahmen der typischen Objektumgebung als Zurückweisungsklasse. Mittels eines binären Entscheidungsbaumes werden diese Ansichten für die Erkennung des Objekts mit Kamerabildern verglichen. Zu diesem Zweck wird in kleinen Schritten ein Suchfenster über das Kamerabild geschoben und nach jeder Verschiebung festgestellt, ob der Inhalt des Suchfensters einer Ansicht des Objekts oder einer Ansicht der Zurückweisungsklasse ähnlicher ist. Das Ergebnis einer solchen Klassifikation ist die Information, zu welcher Klasse der Bildausschnitt gehört. Diese Information läßt sich mathematisch exakt erfassen und dient als Gütekriterium für die optimale Dimensionierung des Klassifikators. Diese Auslegung führt zu einer Verkleinerung der Entscheidungsbäume, und damit zu einer schnellen und robusten Erkennung. Für die Geschwindigkeitssteigerung des gesamten Erkennerverfahrens wurden zusätzlich noch zwei unterschiedliche Verfahren zur effizienten Vor-Auswahl von Information entwickelt, die eine Objekterkennung in Echtzeit erlauben. Dadurch kann das Verfahren auch für die Objekterkennung und -verfolgung in einer Videosequenz eingesetzt werden. Eine Fortschreibung und Prädiktion der Objekttrajektorie in einer Videosequenz wird durch eine Hypothesenfortschreibung ermöglicht; die hohe Dynamik des Erkenners ermöglicht damit auch den Einsatz des Erkenners in geschlossenen Regelkreisen. Die Praxistauglichkeit, insbesondere die Robustheit der entwickelten Verfahren wird beispielhaft mit einer prototypischen Implementierung für den mobilen Serviceroboter ROMAN und einer schnellen Gesichtsdetektion nachgewiesen.
«
Gegenstand dieser Arbeit ist die schnelle, ansichtsbasierte Objekterkennung in Videosequenzen. Das entwickelte Verfahren verwendet als implizites Modell eines Objekts nur Aufnahmen des Objekts und Aufnahmen der typischen Objektumgebung als Zurückweisungsklasse. Mittels eines binären Entscheidungsbaumes werden diese Ansichten für die Erkennung des Objekts mit Kamerabildern verglichen. Zu diesem Zweck wird in kleinen Schritten ein Suchfenster über das Kamerabild geschoben und nach jeder Verschiebu...
»