Interaktives Lernen
 

Situationserfassung in Mensch-Roboter-Interaktion

Autonome Serviceroboter verrichten Dienstleistungen im direkten menschlichen Umfeld. Dadurch ist eine intensive, natürliche Mensch-Roboter Interaktion notwendig. Neben verbaler Kommunikation spielt beim Menschen auch die nicht-verbale Kommunikation, sowie die passive Interpretation menschlichen Verhaltens durch den Roboter eine große Rolle.
In unserem Team wurde daher ein
System entwickelt, welches ausschließlich mittels Sensorik auf dem Roboter menschliche Aktivitäten in Echtzeit erfassen kann. Die verwendeten Sensoren sind dabei vor allem ein 3D-time-of-flight Sensor, welcher mit aktiver Aussendung von Infrarotlicht arbeitet, sowie unterstützend auch Farbkameras. Dabei wird ein Zylindermodell, welches den menschlichen Körper approximiert, in Echtzeit im Bild nachgeführt. In einem zweiten Schritt wird das Körpermodell durch den Einsatz von Support Vector Machine Klassifikation auf dem Raum der Zylinderorientierungen und Geschwindigkeiten semantisch interpretiert.

Probabilistische Entscheidungsverfahren

Autonome Serviceroboter sollen in der Lage sein, im Rahmen ihrer Tätigkeiten selbstständig zu handeln und damit auch vor allem in einer dynamischen Umwelt selbstständig entscheiden zu können. Allerdings haben reale Umgebungen stochastische Dynamiken und die Sensoren der Roboter liefern keine perfekten Messwerte. Daher bietet sich die stochastische Entscheidungstheorie als Grundlage für Steuerungsverfahren an. Für Serviceroboter kristallisieren sich hier nun mehr und mehr die partially observable Markov decision processes (POMDPs) als geeignete Methodik heraus. In unserem Team wurde ein Steuerungs- und Entscheidungssystem entwickelt, welches es ermöglicht einen Serviceroboter mittels POMDPs autonom handeln zu lassen. Dabei wird ein Filtersystem eingesetzt, welches die multimodale Wahrnehmung in eine für POMDPs geeignete Repräsentation transformiert. Die stochastischen Szenariomodelle werden wiederum über einen Syntheseprozess aus ontologischem Hintergrundwissen gewonnen.

Ausführung durch Serviceroboter

Neben statischen Sensorplattformen, wie etwa dem PdV-Center zur Beobachtung des Menschen, dienen vor allem Roboterplattformen zur realistischen, experimentellen Evaluation der verschiedenen Verfahren. Dabei werden die Verfahren zur Kognition und Entscheidung und das gelernte Wissen auf physischen Robotern in realen Szenarios, inklusive Mensch-Roboter-Interaktion verwendet. In unserem Team sind vor allem der Roboter Albert II und die Testplattform MILD die Systeme zur Evaluation der entwickelten Verfahren. Dabei zeichnen sich diese Systeme durch Multimodalität sowohl in Sensorik, als auch Aktorik, aus. Das bedeutet konkret, dass die verschiedenen Handlungsfähigkeiten Mobilität und Navigation, Greifen und Objektmanipulation, Spracherkennung und -synthese, sowie erkennung menschlicher Aktivitäten und Gestik existieren. Das zentrale Steuerungs- und Entscheidungssystem koordiniert dabei die einzelnen Fähigkeiten und ermöglicht die Autonomie des Serviceroboters. Dabei steht die völlige Autonomie des Roboters im Mittelpunkt, so werden Daten zur Visualisierung, Aufzeichnung und späteren Analyse über Funk ausschließlich nach außen gesendet.

Programmieren durch Vormachen

Interaktives LernenZukünftige Service­ und Haushaltsroboter müssen in dyna­mischen und unstrukturierten Umgebungen agieren und in der Lage sein, sich an diese anzupassen. Des Weiteren müssen derartige Systeme neue Fähigkeiten, welche in der Regel individuell nur vom Endbenutzer spezifiziert werden, intuitiv und interaktiv erlernen können. Die bisherige Programmierung über Teachpanels oder textuelle Interfaces ist dem anvisierten Endbenutzer nicht zuzumuten, weil zum einen dieser nicht über das nötige Systemwissen verfügt und zum anderen die Programmierung komplexer Handlungsfolgen ein sehr aufwändiger Prozess ist.
Im Kontext des "Programmieren durch Vormachen" werden neue, intelligente Ansätze der Roboterprogrammierung unter sucht. Diese sollen es Robotern gestatten, von Menschen zu lernen. Die Grundidee besteht darin, den Benutzer die auszuführende Aufgabe selbst vorführen zu lassen. Diese Vorführung wird in einem Trainingscenter durch dedizierte Sensorsysteme beobachtet, in sinnvolle Abschnitte unterteilt und das Ziel jedes Handlungsabschnittes festgelegt. Danach werden die einzelnen Segmente dann zu einer abstrakten Handlungsrepräsentation, einem sogenannten Makrooperator zusammen gesetzt, der auf einen beliebigen Roboter übertragen werden kann. Dazu sind unterschiedliche Kinematiken und Übertragungsfunktionen definierbar.

Die Abbildungen zeigen das Trainingscenter zur Vorführung beliebiger Aufgaben. Die verwendete Sensorik besteht aus Datenhandschuhen und schwenkbaren Stereokameraköpfen. Die aufgenommene Handlungssequenz wird über den Fähigkeitstransfer direkt auf einem beliebigen Robotersystem ausführbar gemacht. Eventuell wird vorher die Ausführung durch Simulation überprüft und gegebenenfalls modifiziert. Um eine intuitive Benutzerschnittstelle zur Verfügung zu stellen, werden in das gesamte System Sprachein und ­ausgabe, Gestenerkennung und ikonische Kanäle integriert.