Seit über vier Jahren wird im Landesamt für Geoinformation und Landesvermessung Niedersachsen (LGLN) eine Software entwickelt, die mit Hilfe von künstlicher Intelligenz (KI) Gebäude in Luftbildern erkennen kann. Es war ein weiter Weg vom ersten Prototypen bis zur produktiven Anwendung. Doch seit diesem Jahr unterstützt die KI bei einem ersten Fachverfahren, indem sie die Menschen bei einer sehr mühevollen Aufgabe ersetzt.
Künstlicher Intelligenz in der Vermessungs- und Katasterverwaltung Niedersachsen
Spätestens seit der Veröffentlichung von ChatGPT Ende 2022 ist das Thema KI im Alltag von vielen Menschen angekommen. Chatbots beantworten nicht mehr nur Fragen, sondern generieren vollständige Texte und realistische Bilder zu fast jedem Thema. Dabei ist das, was uns die KI abliefert, häufig so gut, als hätte es ein Mensch geschaffen.
Hinter ChatGPT und anderen Chatbots stehen „Große Sprachmodelle“ (engl.: Large Language Modells, LLMs). Diese KI-Modelle wurden mit vielen Texten trainiert und sind dadurch in der Lage, menschliche Kommunikation nachzubilden. Die Entwicklung, das Training und die Anwendung solcher KI-Modelle gehören zum Fachbereich des „Maschinellen Lernens“, wird aber umgangssprachlich meistens einfach „KI“ genannt.
Auch im Bereich der (Luft-) Bildanalyse haben sich in den letzten Jahren Methoden des Maschinellen Lernens durchgesetzt und erstaunliche Möglichkeiten geschaffen. Im Bereich der Bildklassifikation kann die KI heutzutage zuverlässig unterscheiden, ob auf dem Foto zum Beispiel eine Katze oder ein Hund zu sehen ist. Ein anderes Anwendungsfeld ist die Objekterkennung. Hierbei erkennt die KI in den Kamerabildern zum Beispiel Fahrzeuge, Personen oder andere Objekte. Dies ist beispielsweise für das autonomes Fahren eine wichtige Fähigkeit.
Ein dritter Bereich der Bildanalyse, wo KI zum Einsatz kommt, ist die Bildsegmentierung. Hierbei wird jedes Pixel eines Bildes klassifiziert, beispielsweise in die Klassen „Person“ oder „keine Person“. Oder in der Satellitenfernerkundung in die Klassen: „Wald“, „Siedlungsgebiet“, „Wasser“ und „Agrarfläche“.
Die erste KI, die im LGLN zum Einsatz kommt, gehört ebenfalls in den Bereich der Bildsegmentierung. Vereinfacht gesagt klassifiziert sie jedes Pixel eines Luftbildes in die Klassen „Dach“ und „kein Dach“. Somit ist es der KI möglich, die Lage und Form jedes aus der Luft sichtbaren Gebäudes zu erfassen. Genau genommen nutzt die KI dabei keine Luftbilder, sondern Digitale Orthophotos (DOP), also auf eine Referenzfläche entzerrte und damit lagerichtige Luftbilder. Da heutzutage bei den DOPs ein digitales Oberflächenmodell als Referenzfläche verwendet wird, spricht man auch von True DOPs. In diesen sind auch die Dächer der Gebäude lagerichtig abgebildet und verdecken keine Bereiche neben den Gebäuden. Wie in den meisten Bundesländern haben diese True DOPs in Niedersachsen eine Bodenpixelgröße von 20 Zentimeter.
Für jedes Pixel dieser True DOPs gibt es fünf Werte, die von der KI zur Gebäudeerkennung genutzt werden: Je einen Wert für die Farben Rot, Grün, Blau und Nahen Infrarot und ein fünfter Wert für die Höhe. Dieser fünfte Wert wird aus der Differenz zwischen einem Geländemodell und einem Oberflächenmodell berechnet und beschreibt die Höhe der Objekte (zum Beispiel Gebäude, Bäume, Fahrzeuge) auf dem Gelände.
Bevor die KI jedoch in der Lage ist, bisher noch nicht bekannte Gebäude zu finden, muss sie für diese Aufgabe trainiert werden. Als Trainingsdaten werden dabei sehr viele Beispiele benötigt, wie sich Gebäude in den fünf jeweiligen Pixelwerten darstellen. Die Qualität einer KI hängt hier entscheidend von der Qualität der Trainingsdaten ab. Für eine gute KI, dürfen die Trainingsdaten nur wenige Fehler enthalten, müssen repräsentativ sein und sollten in ausreichender Anzahl vorliegen.
Alkis als Grundlage
Oft ist die Erstellung oder Beschaffung solcher Trainingsdaten die größte Herausforderung bei der Entwicklung einer KI. Im LGLN existiert für die benötigten Trainingsdaten jedoch bereits eine sehr gute Grundlage: Im Amtlichen Liegenschaftskatasterinformationssystem (Alkis) sind Lage und Form fast aller Gebäude erfasst und seit 2023 ist ganz Niedersachsen erstmals vollständig mit True DOPs erfasst. Ein Geländemodell und ein Oberflächenmodell liegen ebenfalls bereits vor, sodass die fünf Werte pro Pixel flächendeckend vorhanden sind.
Kombiniert man diese Datensätze, erhält man einen sehr großen Trainingsdatensatz, mit dem auch komplexere KI-Modelle trainiert werden können. Im LGLN werden die Daten genutzt, um KI-Modelle zu trainieren, die seit Ende 2022 auf einer Architektur basieren, die unter dem Namen „Polygonal Building Extraction by Frame Field Learning“ in Frankreich entwickelt wurden.
Für das Training solcher großen KI-Modelle werden sehr leistungsstarke Grafikkarten mit viel Speicher benötigt. Das LGLN verwendet deshalb die für KI-Anwendungen sehr verbreiteten NVIDIA A100. Diese werden von der Cloud-Plattform Code-DE für Behörden in Deutschland bereitgestellt und können auch vom LGLN genutzt werden.
Im Ergebnis der neuesten KI-Generation zur Gebäudeerkennung, die vom LGLN trainiert wurde, sind die Gebäude mit einer sehr hohen Vollständigkeit und Korrektheit erkannt worden. Ein großer Vorteil der verwendeten KI-Architektur ist die exakte Erkennung der Gebäudegeometrie. Die KI zeichnet die meist eckige Form der Dächer sehr präzise nach.
Weitere Informationen unter https://www.lgln.niedersachsen.de/