3D Object Recognition Through a Process Based on Semantics Including Autoadaptation to the Context3D-Objekterkennung durch ein auf Semantik basierendes Verfahren mit automatischer Anpassung an den Kontext

Jean-Jacques Ponciano, Frank Boochs, Alain Trémeau

Die fortschreitende Transformation unserer realen Welt in digitale Repräsentationen verlangt zunehmend nach Werkzeugen, die es erlauben, unstrukturierte Daten zu verstehen. Beiträge zu diesem Problem kommen aus dem Bereich der Computer Vision, in dem sich mittels verschiedener Strategien Objekte in Datensätzen erkennen und klassifizieren lassen. Solche Strategien sind z. B. modellbasiert und konzentrieren sich typischerweise entweder auf eine bestimmte Art von Daten, einen Kontext (Innenraum, Außenbereich) oder einen Satz von Objekten. Andere Ansätze basieren auf Konzepten des maschinellen Lernens. Sie bieten eine höhere Flexibilität, fußen aber auf einem kostspieligen Schritt der Annotation von Daten als Voraussetzung für das Training des Lernprozesses. Das führt zu Problemen, wenn Daten nicht oder nicht in erforderlichem Umfang verfügbar sind, wie es in Anwendungsfeldern wie z. B. Der Archäologie der Fall sein kann. Um solche Einschränkungen zu überwinden, schlagen wir vor, das implizit in den Daten enthaltene und durch den Trainingsprozess erschlossene Wissen durch explizit formuliertes Wissen in einem vollständig Semantik-geführten Ansatz zu ersetzen. Die Semantik formuliert verschiedene Wissenszweige und deren Verknüpfungen, wie z. B. Wissen über die Repräsentation der Objekte in den Datensätzen und zu den auf die Daten anzuwendenden Algorithmen. Der Ansatz enthält auch eine Lernphase, mit deren Hilfe sich die Verarbeitung an die Vielfalt der Objekte und die Datenmerkmale anpassen lässt. Die Semantik ist über ein ontologisches Modell ausgedrückt und verwendet Standard-Webtechnologien wie SPARQL-Abfragen und bietet entsprechend große Flexibilität. Das ontologische Modell beschreibt das Objekt, die Daten und die Algorithmen. Es erlaubt die Auswahl und Ausführung von Algorithmen, die an Daten und Objekte angepasst sind. Erzielte Verarbeitungsergebnisse werden klassifiziert und erlauben, das ontologische Modell mithilfe von SPARQL-Konstruktabfragen anzureichern. Die durch SPARQL formulierte Semantik dient auch als Verbindung zwischen dem Wissen innerhalb des ontologischen Modells und dem Verarbeitungsbereich. Es bietet die Fähigkeit, die Verwendung der Algorithmen auf einen individuellen Zustand der Verarbeitungskette auszulegen und macht die Lösung anpassungsfähig. Diese Anpassungsfähigkeit wird in zwei Fallstudien gezeigt. Die erste Fallstudie zielt auf die Erkennung von kleinen Objekten in einer Indoor-Punktwolke, die mit kostengünstiger 3D-Technologie erfasst wurde. Im Gegensatz dazu zielt die zweite Fallstudie auf die Identifizierung größerer Objekte in einer durch Laserscanning erfassten Punktwolke im Außenbereich ab. Für beide Fallstudien erzielt der semantikgeführte Ansatz gute Ergebnisse. Durch die Einbeziehung der kontext-spezifischen Lernphase ließen sich die Qualität weiter verbessern und damit Autos, Motorräder und Verkehrsschilder besser erkennen, als bei anderen bekannten Ansätzen.
Schlüsselwörter: 3D-Punktwolke, Objekterkennung, lernende Semantik, Künstliche Intelligenz, semantische Segmentierung, Klassifizierung

Der Volltext der aktuellen Artikel (< 3 Monate) aus dem Artikelarchiv steht für avn-Abonnenten zur Verfügung.
Hier finden Sie mehr Informationen zum avn-Abonnement.