Fachbeiträge

[Interview] Klimamonitoring durch Zeitreihenanalyse

Der Deutsche Wetterdienst (DWD) setzt neuerdings ein Analysetool ein, welches es ermöglicht, Zeitreihenanalysen auf mehrdimensionalen Klimadaten durchzuführen und damit neue Erkenntnisse zu gewinnen, die unsere Klimaentwicklung betreffen: den rasdaman Big Data Server. Mit Hilfe der neuen Auswertetechnik gewinnen Klimadatenanalysen eine völlig neue Qualität und vielfältige Möglichkeiten im Bereich des Klimamonitorings.
Ein Interview mit Karsten Friedrich, Hydrologe des DWD, geführt von Heike Hoenig.

Perzentile des Niederschlags für Mai-Juni 2013: Die Abbildung zeigt die Über- und Unterschreitung bestimmter Perzentilgrenzen des Niederschlags für den Zeitraum Mai-Juni 2013. Datengrundlage ist die monatliche Rasterauswertung des Weltzentrums für Niederschlagklimatologie mit der Berücksichtigung der Referenzperiode 1951-2010. Erhebliche Niederschläge Ende Mai und Anfang Juni führten zu extremen Hochwassersituationen an der Donau und der Elbe. (Quelle: DWD)

Worin bestand die Zusammenarbeit des DWD mit rasdaman GmbH und was war die Intention dieser Kooperation?

Das gemeinsame Projekt entstand im Rahmen der regionalen Klimaüberwachung. Dieser Ausdruck ist ein wenig irreführend, weil man meinen könnte, es geht dabei nur um eine kleinräumige Überwachung. Das ist so nicht richtig: Die Weltorganisation für Meteorologie (WMO) hat die Erde in sechs Regionen unterteilt. Europa gehört neben dem Nahen Osten zur Region VI. Die Wetterdienste dieser Region arbeiten hier sehr eng zusammen und übernehmen unterschiedliche Aufgabenstellungen. Der Deutsche Wetterdienst ist verantwortlich für das Klimamonitoring, also die Auswertung der Klimadaten in dieser Region. Mit den Produkten, die wir erzeugen, unterstützen wir die nationalen Wetterdienste, denn sie sind teilweise sehr unterschiedlich ausgestattet, haben nicht das Know-how und es stehen ihnen nicht immer alle Informationen zur Verfügung.

Unser Ziel war es, uns den Zeitraum 1951 bis 2010 in Europa und dem Nahen Osten anzuschauen und Klimanomalien zu entdecken. Bisher gab es für uns keine Möglichkeit, eine Zeitreihe von Rasterdaten ohne großen Programmier- und Rechenaufwand auszuwerten. Um das zu tun, muss man eine Technologie haben, die mehrdimensionale Daten auswerten kann. Wir stießen da bisher an unsere Grenzen, bis wir den rasdaman Datenserver eingesetzt haben.

Bei rasdaman ging es primär um die Parameter Temperatur und Niederschlag: Wir haben den von unseren holländischen Nachbarn erzeugten Temperaturdatensatz für Europa in die Datenbank eingespeist. Hinzu kam der Niederschlagsdatensatz des Weltzentrums für Niederschlagsklimatologie WZN, das durch den DWD betrieben wird.

Das ist ein globaler Datensatz basierend auf qualitätskontrollierten Niederschlagsmessungen. Unser Interesse war es, für unterschiedliche Zeiträume Perzentildarstellungen zu erzeugen.

Was sind denn Perzentile?

Die Perzentildarstellungen, die wir erstellen, beziehen sich auf die jeweiligen Parameter Temperatur und Niederschlag. Dazu wählt man eine Beobachtungsreihe aus und schaut, wie viel Niederschlag pro Monat in dem ausgewählten Zeitraum in einer bestimmten Region gefallen ist. Diese Werte werden dann der Größe nach sortiert und es wird analysiert, wie sich der Niederschlag des aktuellen Monats in die Rangliste der in den bisherigen Monaten beobachteten Niederschläge einreiht.

Entspricht die Niederschlagmenge dem Median, d.h. waren 50 % der bisherigen Monate trockener und 50% nasser, spricht man vom 50 % Perzentil. Liegt der betrachtete Wert über einem bestimmten Perzentilwert, ergibt sich eine Überschreitung eines Schwellenwertes. Der Schwellenwert kann z.B. bei 80 oder 90% aller Beobachtungen liegen, d. h. das 80 oder 90 % Perzentil wurde erreicht oder überschritten. Genauso kann auch eine Unterschreitung zutage treten, wenn ein Monat sehr trocken war. Es geht immer darum, die bisher beobachteten Größen zu sortieren und den aktuell gemessenen Wert mit den bisherigen Beobachtungen zu vergleichen. Die Ereignisse am Rand der Rangliste (10 % oder 90 % Perzentil) treten wesentlich seltener auf und stellen extrem trockene bzw. extrem niederschlagsreiche Monate dar.

Wann spricht man von einer Klimaanomalie?

Eine Klimaanomalie ist eine Abweichung vom normalen Klima. Normal bedeutet hier, dass die Klimadaten dem vieljährigen Mittel über einen langen Zeitraum entsprechen. In der Regel wird hierfür je nach Fragestellung der von der WMO empfohlene 30-jährige Zeitraum 1961-1990 oder 1981-2010 verwendet. Wir haben aber immer eine gewisse Klimavariabilität. Von Jahr zu Jahr ändert sich das Niederschlagsaufkommen oder die Temperatur. Die Klimavariabilität ist abhängig vom Klima des einzelnen Ortes und der Jahreszeit. Mit Hilfe der Perzentile können wir aber zuverlässig einordnen, ob es sich nun um eine extrem feuchte Periode (Monat, Jahreszeit, Jahr) gehandelt hat oder um eine trockene, d.h. ob eine bestimmte Klimaanomalie an einem Ort und zu einer bestimmten Jahreszeit sehr selten vorkommt oder öfter.

Warum ist das so interessant?

Auf extrem seltene Klimaanomalien sind wir gerade wegen ihrer Seltenheit meist nicht eingestellt. Sie verursachen auch oft gravierende Schäden oder kosten sogar Menschenleben. Daher müssten wir gerade solche Ereignisse möglichst gut erfassen, nicht nur beim Niederschlag, sondern auch bei anderen Klimagrößen. So wie wir Niederschlagskarten erstellen, machen wir auch Auswertungen für die Temperatur. Mit Perzentilen identifizieren wir besonders warme oder kalte Perioden. Mit der rasdaman Datenbanklösung können wir völlig beliebige Zeiträume betrachten, je nachdem wie die Daten vorliegen. Dies war uns bisher nicht oder nur mit sehr großem Aufwand möglich, bevor wir das neue Auswertetool eingesetzt haben. Das amerikanische Universitätsinstitut International Research Institute for Climate and Society erstellt monatliche Abbildungen der Perzentile. Mit der rasdaman Technologie haben wir jetzt aber auch die Möglichkeit, beliebige Zeiträume wie Jahres- oder Regenzeiten auszuwerten. Gerade ganz aktuell gab es in Brasilien ein Ausbleiben der Regenzeit, und wir werten derzeit aus, wie sich die Perzentildaten darstellen. Durch die rasdaman Architektur können wir uns heute völlig variabel durch die mehrdimensionalen Klimadaten, den Datenkubus, bewegen. Rein faktisch können wir jetzt eine Auswertung von November 2014 bis Februar 2015 vornehmen. Das ist ein absolutes Novum und bietet neue Möglichkeiten zur Klimadatenanalyse.

Ihre Auswertungen betreffen nicht nur Europa. Schalten Sie sich da trotzdem ein?

Ja, insbesondere das WZN hat großes Interesse an diesen Auswertungen gezeigt. Die WMO erstellt regelmäßige Publikationen zum Zustand des globalen Klimas, zu denen der DWD Beiträge zuliefert. Dabei wird auch der Niederschlag betrachtet. Wir hatten jetzt schon eine Anfrage von einem australischen Autor für diese neue Form der Zeitreihenanalyse. Wir werden unsere Auswertungen gern zur Verfügung stellen.

Können Sie mit dieser Methode auch den Klimawandel besser einschätzen?

Eher ist es eine Methode um die Klimavariabilität besser einschätzen zu können. Wie stark variiert das Klima von Monat zu Monat, von Jahr zu Jahr? Für den Einfluss des Klimawandels würde man noch andere Methoden verwenden. Man würde eher Trends berechnen. Genau das haben wir mit der rasdaman Technologie in Zukunft vor. Die Perzentilberechnungen sind ein erster Schritt in diese Richtung. Wir schauen jetzt, wie wir unsere Analysen weiterentwickeln können. Trendberechnungen sind eine weitere Möglichkeit, da wir uns ganz einfach in unserem Datenkubus in jede beliebige Richtung, also auch in der Zeitrichtung bewegen können. Wir sind in der Lage, für jeden Rasterpunkt ganz einfach die Zeitreihe zu bestimmen, d.h. für jeden Gitterpunkt des Rasters die Daten von fortlaufenden Monaten herauszuholen. So gehen wir auch für die Berechnung der Perzentile vor: Wir extrahieren die Zeitreihe und werten aus, wie sich der aktuelle Zeitraum einordnet. Zusätzlich kann die zeitliche Entwicklung betrachtet werden: Zeichnet sich ein bestimmter Trend ab und ist der Trend signifikant, also statistisch gesichert?

Wie ist man vorher an vergleichbare Fragestellungen herangegangen?

Bisher haben wir nur Anomalien berechnet. Wir hatten lediglich die Referenzperiode und einen aktuellen Wert. Damit haben wir die Abweichungen vom Mittelwert bestimmt und für den Niederschlag auch die prozentuale Anomalie.

Ist diese Methode jetzt exakter?

Ja, es ist noch einmal eine ganz andere Aussage, weil wir jetzt etwas über die Wahrscheinlichkeit des Wiedereintritts von Ereignissen sagen können. Bei der absoluten oder prozentualen Abweichung hat man einfach nur eine Art Mengenangabe, nämlich die mittlere Intensitätsangabe. Wir haben nun zusätzlich noch die statistische Möglichkeit, eine Einordnung in die so genannte „Wiederkehrzeit“ vorzunehmen. Wir können also nicht nur ermitteln, wie groß die mittlere Abweichung war, sondern auch wie oft sie im Mittel vorkommt.

Welche Art der Datenanalyse ist jetzt möglich?

Natürlich haben wir vorher auch Messdaten verarbeitet. Durch die rasdaman Lösung können wir jetzt aus gemessenen Daten abgeleitete Raster untersuchen. Wir haben immer für eine Station einen bestimmten Messwert. Um sich aber ein Bild über ganz Deutschland oder Europa machen zu können, versucht man seit jeher mit verschiedensten Verfahren die Punktmessungen in die Fläche zu interpolieren Bei der Temperatur hat man eine Höhenabhängigkeit, da wird bei der Interpolation die Topografie berücksichtigt. Niederschlag wird an wesentlich mehr Stationen als die Temperatur beobachtet, Niederschlag ist viel variabler. Es kann an einem Ort gerade einen Gewitterschauer geben und 10 km weiter scheint immer noch die Sonne. Das Niederschlagsmessnetz ist wesentlich dichter. Die abgeleiteten Rasterdaten können jetzt in unterschiedlicher Weise ausgewertet werden.

Liefern Zeitreihenanalysen einen Ansatz für das Klimamonitoring der Zukunft? Was könnte ein hehres Ziel für die künftige Klimasimulation sein?

Wir können mit der rasdaman Technologie neuerdings exakt Hitze- oder Kältewellen identifizieren. Wir machen uns hier die Möglichkeiten der Anwendung zunutze. Für den Temperaturdatensatz haben wir tägliche Daten zur Verfügung. So schauen wir, ob es über einen bestimmten Zeitraum einen bestimmten Temperaturwert gab, bzw. ob ein bestimmtes Temperaturperzentil über- oder unterschritten wurde. Wenn das der Fall ist, merkt sich die Anwendung die Positionen. Im nächsten Schritt wird der zeitliche Verlauf dieser Temperaturüber- und –unterschreitungen analysiert. Wenn es im gleichen Gebiet länger anhaltende Zeiträume gegeben hat, in dem ebenfalls eine Temperaturüber- oder –unterschreitung vorgekommen ist, dann spricht man von einer  Hitze- oder Kältewelle.

Für die Zukunft schwebt uns vor, nicht nur Messdaten in die rasdaman Datenbank einzuspeisen, sondern auch Daten aus Wettervorhersagemodellen. Wir würden dann für die kommenden 5 oder 10 Tage Temperaturdaten importieren und genau die gleiche Analyse durchführen. So könnten wir frühzeitig anstehende Hitze- oder Kältewellen identifizieren und davor warnen. Das gleiche kann auch für längere Zeiträume durchgeführt werden, also für Monats- oder Jahreszeitenvorhersagen oder sogar für Klimasimulationen über die nächsten Jahre und Jahrzehnte.

Sie haben mit sehr komplexen Daten zu tun. Haben Sie eine Herausforderung im Sinne von „Big Data“?

Unsere Datenbank wird gespeist durch Rasterpunkte. Im Wesentlichen sind es 3-dimensionale Daten. Es kommt aber auf die Ablage in der Datenbank an: Ein Temperaturdatensatz ist bei uns 5-dimensional: Die erste und zweite Dimension bezeichnet die geografische Ausdehnung. Tage, Monate und Jahre sind in weiteren drei Dimensionen abgelegt. Der Niederschlagsdatensatz ist 4-dimensional, weil es sich dabei um Monatsdaten handelt. Es sind schon viele Daten, die von uns in der Datenbank gehalten werden, aber durch die rasdaman Architektur können wir einen bestimmten Datenpunkt, einen einzelnen Rasterpunkt, sehr gut ansprechen. Man müsste sonst andere Programme laufen lassen und mehrere Dateien öffnen, um eine Zeitreihe für den Niederschlag zu erhalten, denn die Niederschlagsdaten werden für gewöhnlich monatsweise in Dateien abgelegt.

Für unser Beispiel bedeutet das konkret: Wenn man eine Zeitreihe von einem Rasterfeld generiert, müsste man 60 Dateien öffnen, um für den einen Punkt eine Zeitreihe von 1951 bis 2010 zu extrahieren. Diese Dateien müssten geöffnet, der Punkt herausgelesen und zwischengespeichert werden, damit man die Zeitreihe weiter verarbeiten kann. Bei der rasdaman Datenbanklösung spricht man einfach die Zelle an, gibt den Zeitraum an und hat innerhalb eines Bruchteils einer Sekunde diese Zeitreihe generiert, ohne dass man Dateien öffnen, auslesen und schließen muss. Das ist ein sehr einfaches Datenhandling. Es bedarf natürlich einer Einarbeitung in die rasdaman Oberfläche, aber wenn man das Prinzip verstanden hat, ist man sehr schnell und variabel.

Sind Sie zufrieden mit der Funktionalität von rasdaman?

Derzeit wird die rasdaman Datenbanklösung in der Klimatologie verwendet, also in der Bewertung zurückliegender Witterungssituationen. Vielleicht wird die Architektur künftig auch in der Wettervorhersage eingesetzt, z.B. für die Flugmeteorologie. Ich finde die Herangehensweise und die Möglichkeiten, die man mit rasdaman hat, superspannend.

Die Flugmeteorologie erfordert also eine Art „Spontanwetteranalyse“?

Genau. Derzeit arbeitet der DWD da an einer Modellweiterentwicklung. Im Februar wurde das neue Globalmodell operationell geschaltet. Die Wettervorhersage erfolgt in mehreren Schritten. Da die Wettervorhersage mit wahnsinnig vielen Rechenschritten verbunden ist, berechnet man das globale Wettergeschehen auf einem groben Gitternetz. Dann betrachtet man einen kleineren Ausschnitt, z.B. Europa und in einem weiteren Schritt einen noch kleineren Ausschnitt wie z.B. Deutschland. Das sind mehrere Modellläufe hintereinander. Zu bestimmten Uhrzeiten, meistens in 3- oder 6-Stunden Intervallen, werden die Modelle mit aktuellen Wetterdaten gefüttert und gestartet. Die Ergebnisse bilden dann die Grundlage für die Wettervorhersage, für die weitere Interpretation des Wettergeschehens, z.B. auch für die Flugmeteorologie. Also Wetter auf „Knöpfchendruck“ gibt es leider nicht, aber dafür regelmäßige Termine zu denen die Wettervorhersage gestartet wird.

Das neue Modell, das beim DWD entwickelt und angewendet wird, ist von der Aufteilung des Gitternetzes, an denen die Berechnung der meteorologischen Parameter erfolgt, anders gestaltet als bisherige Modelle, hat eine andere Herangehensweise. Hier hat man die Möglichkeit das Gitternetz für bestimmte Regionen zu verkleinern, so dass man auch in einem Modelllauf eine höher aufgelöste Berechnung  vornehmen kann. Vorher wurden die Ergebnisse von einem gröberen Modell zu einem feineren Modell weitergereicht. Jetzt ist es möglich, innerhalb des einen Modelles, je nach Interesse, auf unterschiedlich aufgelösten Gitternetzen zu rechnen. Die Umsetzung erfolgt nach und nach. Derzeit nur global, Ende des Jahres wird das Europagitter eingeführt, dann ein Gitter für Deutschland.

Autorin: Heike Hoenig; Wissenschaftsjournalistin
www.heike-hoenig.de