Fachbeiträge

Datenwürfel-Analyse leicht gemacht

Das Projekt BigDataCube verfolgt einen neuartigen Datenwürfel-Ansatz: Alle Daten eines Satelliten-Instruments werden in Raum und Zeit ausgerichtet und Nutzern als einziges großes Objekt angeboten.

Die Datenwürfelanalyse in Raum und Zeit bietet viele Vorteile (Bild: Shutterstock_rasdaman)

Autorin: Heike Hoenig

Angesichts der Sentinel-Datenflut stehen Anwender – vor allem veredelnde Dienstleister ohne tiefe Datenmanagement-Kernexpertise – einigermaßen hilflos vor einem Angebot aus Myriaden von Satellitenbildern. Kataloge versuchen Abhilfe zu schaffen, jedoch gelingt dies nur unvollständig: Nach wie vor muss der Benutzer selbst aus der Unzahl von verfügbaren Szenen wählen. Nach wie vor bestehen die Treffer aus Dateien, die hinsichtlich Größe in aller Regel nicht ­­exakt den Nutzerbedürfnissen entsprechen. Daher werden viele Pixel übertragen, welche gar nicht gebraucht werden – dies bringt eine unzureichende Dienstequalität mit sich, insbesondere da der Nutzer die Berechnungen darauf selbst durchführen muss.

Durch BigDataCube soll die Daten­nutzung der Sentinels und anderer Erd­beobachtungssatelliten verbessert und erweitert werden. Im Projekt soll die in Deutschland entwickelte Datenwürfel-Technologie rasdaman dazu auf Code-DE sowie in der kommerziellen Cloud-Um­gebung der Cloudeo AG installiert werden, um beispielhaft interaktive Analyse­dienste anzubieten und miteinander zu vernetzen.

Die DLR-Forschungsstelle für Maritime Sicherheit in Bremen wird im Rahmen des Projekts ihre bestehenden automatischen Prozessoren für Wind und Seegang aus SAR-Aufnahmen (Synthetic Aperture Radar) zur Verwendung in Datenwürfeln anpassen. Damit ließen sich beispielsweise An­fragen wie „höchster Seegang an der deutschen Nordseeküste im Jahr 2017“ oder „mittlere Windgeschwindigkeit am geplanten Standort eines Offshore-Windparks“ sehr einfach aus den vorhandenen Erdbeobachtungsdaten beantworten.

Das Angebot aller Daten eines Satelliten-­In­struments als ein einziges, raumzeitlich ausgerichtetes Objekt bietet dem Nutzer einige Vorteile:

  • Bessere Überschaubarkeit der zu betrachtenden (und evtl. zu kombinierenden) Objekte.
  • Umständliche, nutzerunfreundliche Hilfsmaßnahmen wie Semantik tragende Datei­namen entfallen; stattdessen geschieht die ­Extraktion intuitiv durch Ausschnittbildung in Raum und Zeit.
  • Datenwürfel, als multidimensionale Objekte, vereinheitlichen eine Vielzahl von bisher unterschiedlich gehandhabten Datentypen: 1D-Sensor-Zeitreihen, 2D-Satelliten-Szenen, 3D-x/y/t-Satelliten-Zeitreihen und geophysikalische x/y/z-Voxel-Daten sowie 4D-x/y/z/t-Wetterdaten. Damit lassen sich ­Datenwürfel unterschiedlicher Dimension u.?a. leicht mit­ein­ander kombinieren (beispielsweise Zeit­reihen aus Reflexionsdaten, Höhendaten oder Wetter-Zeitreihen).
  • Auf dem Datenwürfel können mächtige, jedoch einfach zu handhabende Prozessierungsfunktionen angeboten werden – etwa: „Vegetationsindex über Portugal“, „Waldbrand-Risikogebiete über Griechenland“, „kombiniere Wetter-Zeitreihen mit Satellitenbildern“.
  • Damit erhält der Nutzer exakt die Daten, die er benötigt, und in dem Format, das er benötigt: „What you get is what you need“.

Das Projekt BigDataCube wird vom Bundes­ministerium für Wirtschaft und Energie (BMWi) gefördert und hat eine Laufzeit von 18?Monaten. Koordinator ist die Jacobs University (Bremen), weitere Partner sind die Rasdaman GmbH (­Bremen), Cloudeo AG (München) und die DLR-Forschungsstelle für Maritime Sicherheit (­Bremen).

Kontakt:
Heike Hoenig
Wissenschaftsjournalistin
www.heike-hoenig.de