Modellgetriebene Verfolgung formvariabler Objekte in Videobildfolgen
Bei der automatisierten Analyse von menschlichen Bewegungen der Extremitäten und Gesichtszüge mittels videobasierter Techniken kommt der robusten Merkmalsextraktion eine Schlüsselrolle zu. Die zum Einsatz kommenden Methoden zur Bildsegmentierung müssen dabei möglichst unabhängig von den Umgebungsbedingungen sein, um so eine zuverlässige Interpretation der Bilddaten zu gewährleisten.
In dieser Arbeit wird ein System vorgestellt, mit dem durch die Verwendung unterschiedlicher Merkmale formvariable Objekte in Videobildfolgen automatisch verfolgt und deren Bewegungen dreidimensional vermessen werden können. Neben der Berücksichtigung von Farbinformationen wird insbesondere auf die kantenbasierte Merkmalsextraktion eingegangen.
Die Leistungsfähigkeit des Systems wird durch den Einsatz zur Detektion menschlicher Bewegungen in Videosequenzen demonstriert. Das dem System zugrunde liegende generische 3D-Objektmodell dient dabei zur Modellierung des menschlichen Körpers aus mehreren Objektmodellteilen. Zur genaueren Beschreibung werden die einzelnen Objektmodellteile durch Merkmale näher charakterisiert, wodurch gleichzeitig die bei der Bildsegmentierung anzuwendenden Verfahren festgelegt werden. Zur Modellierung deformierbarer Konturen werden bei der kantenbasierten Merkmalsextraktion statistische Punktverteilungsmodelle verwendet. Bei diesen ergibt sich die Beschränkung der Formvariation in natürlicher Weise aus einem Trainingsdatensatz. Die entwickelten kantenbasierten Methoden werden anhand von Beispielen mit der Bildauswertung durch adaptive Farbklassifikation verglichen. Es wird gezeigt, wie die Detektion der für den Menschen charakteristischen Kopf-Schulter Partie dazu verwendet werden kann, um mit einem kalibrierten Stereokamerasystem Personen zu verfolgen und dreidimensionale Trajektorien für deren Bewegung zu erhalten. Zur genaueren Lokalisation der Gesichtszüge im Bild wird ein mehrteiliges Konturmodell für das Gesicht verwendet, das aus einer hierfür generierten Datenbank erstellt wurde. Das Modell wird für die Verfolgung der Gesichtszüge in Bildsequenzen eingesetzt, und es wird gezeigt, wie der zeitliche Verlauf der Modellparameter dazu verwendet werden kann, um verschiedene Mimiken zu charakterisieren. Die zusätzliche Berücksichtigung von Grauwertinformationen in einem heuristischen Modell führt hierbei zu einer verbesserten Lokalisation im Vergleich zum reinen Kantenmodell. Das vorgestellte System erlaubt die robuste Verfolgung menschlicher Bewegungen in Bildfolgen. Es eröffnet die Möglichkeit einer Vielzahl an Anwendungen, bei denen die automatisierte Interpretation von Gestik und Mimik erforderlich ist, etwa im Bereich der Mensch-Maschine Kommunikation oder auch in medizinischen Anwendungen.
© Copyright 2002 Alle Rechte vorbehalten.
| Schlagworte: | |
|---|---|
| Notationen: | Naturwissenschaften und Technik |
| Sprache: | Deutsch |
| Veröffentlicht: |
München
2002
|
| Online-Zugang: | https://mediatum.ub.tum.de/doc/601712/document.pdf |
| Seiten: | 182 |
| Dokumentenarten: | Dissertation |
| Level: | hoch |