Artikelarchiv

Seite drucken

Empirischer Vergleich von Deep-Learning-Ansätzen zur semantischen Segmentierung von Punktwolken auf realen Brückendatensätzen

An Empirical Comparison of Deep Learning Approaches for Semantic Segmentation of Point Clouds on Real Bridge Datasets

Hristo Vassilev, Jörg Blankenbach

Mit dem Aufkommen von Building Information Modeling (BIM) und Digitalen Zwillingen im Bauwesen steigt der Bedarf an objektorientierten und semantisch angereicherten Bauwerksmodellen zur strukturierten Informationsverarbeitung. Für den Betrieb, die Planung und den Bau im Bestand gilt es jedoch, zunächst entsprechende Bestandsmodelle (as-built/as-is) zu erstellen. Da häufig aktuelle oder vollständige Daten fehlen, müssen diese Modelle mit erheblichem Aufwand aus Aufmaßdaten wie Punktwolken abgeleitet werden. Um die flächendeckende Erzeugung semantisch angereicherter as-is-Modelle zu ermöglichen, ist eine Automatisierung zeitaufwendiger Teilschritte – insbesondere der semantischen Segmentierung der Erfassungsdaten – erforderlich. In diesem Beitrag werden verschiedene Ansätze zur semantischen Segmentierung von Punktwolken, die mit einem mobilen Laserscanner (MLS) erfasst wurden, diskutiert. Zudem werden aktuelle künstliche neuronale Netzwerke (KPConv, PointNeXt, SPT und PTv3) anhand eines Beispieldatensatzes aus dem Brückenbau miteinander verglichen, wobei insbesondere deren Hyperparameter untersucht werden. Die Experimente zeigen, dass die PTv3-Architektur mit einer mean Intersection over Union (mIoU) von 76,11 % deutlich bessere Ergebnisse erzielt als die übrigen untersuchten Modelle, was auf ihr überlegenes effektives rezeptives Feld zurückgeführt werden kann.

With the rise of Building Information Modeling (BIM) and Digital Twins in the construction industry, the demand for object-oriented and semantically enriched building models for structured information processing is increasing. In particular, for operation, planning, and construction in existing structures, corresponding as-built/as-is models must first be created. Since up-to-date or complete data is often lacking, these models have to be derived from surveying data, such as point clouds, with considerable effort. To enable the large-scale generation of semantically enriched as-is models, it is necessary to automate time-consuming subprocesses – especially the semantic segmentation of captured data. This paper discusses various approaches to the semantic segmentation of point clouds captured by a mobile laser scanner (MLS). Additionally, state-of-the-art neural networks (KPConv, PointNeXt, SPT, and PTv3) are compared using a sample dataset from bridge construction, with a particular focus on their hyperparameters. The experiments show that the PTv3 architecture achieves considerably better results than the other investigated models, with a mean Intersection over Union (mIoU) of 76.11 %, which we attribute to its superior effective receptive field.

DOI: 10.14627/avn.2025.5.2
Der Volltext der aktuellen Artikel (< 3 Monate) aus dem Artikelarchiv steht für avn-Abonnenten zur Verfügung.
Hier finden Sie mehr Informationen zum avn-Abonnement.