Zum Hauptinhalt springen

Ruhr Economic Papers #964

2022

Yuliya Shrub, Jonas Rieger, Henrik Müller, Carsten Jentsch

Text Data Rule - Don’t They?

A Study on the (Additional) Information of Handelsblatt Data for Nowcasting German GDP in Comparison to Established Economic Indicators

Die unmittelbare Verfügbarkeit von Informationen über die aktuelle Wirtschaftslage in Echtzeit ist für Prognosen und für die rechtzeitige Anpassung politischer Maßnahmen und wirtschaftlicher Entscheidungen von entscheidender Bedeutung. Während wichtige makroökonomische Indikatoren nur vierteljährlich - und zudem häufig mit erheblicher Verzögerung - veröffentlicht werden, sind andere verwandte Daten in kürzeren Abständen verfügbar, d.h. monatlich, wöchentlich, täglich oder sogar noch häufiger. Ziel des Nowcasting ist es, diese in kürzeren Intervallen erhobenen Variablen zu nutzen, um die Vorhersagen für weniger häufig gemeldete Variablen wie z.B. das Wachstum des BIP zu optimieren. In diesem Beitrag schlagen wir ein Mixed-Frequency-Modell vor, um das Potenzial der Verwendung von Textdaten in Form von Zeitungsartikeln für das Nowcasting des deutschen BIP-Wachstums zu untersuchen. Zeitungsdaten sind daür geeignet, da sie direkt den wirtschaftlichen und sozialen Fortschritt erklären, der das BIP-Wachstum beeinflusst. Zudem sind sie häufig ohne große Verzögerung verfügbar. Wir vergleichen verschiedene Setups, die auf etablierten Makrovariablen basieren, mit und ohne zusätzlich enthaltene Informationen aus (vollständig unüberwacht modellierten) Textdaten sowie ein Setup, das ausschließlich auf diesen Textdaten basiert. Zur Bewältigung der hohen Dimensionalität der betrachteten Daten setzen wir eine Hauptkomponentenregression, Penalisierungsverfahren und Random Forest ein. Die Ergebnisse legen nahe, dass die Einbeziehung von Textdaten in das Nowcasting gewisse Vorteile mit sich bringt, dass aber die Vollautomatisierung der Extraktion von Informationen aus Textdaten tendenziell immer noch zu viel irrelevantes Rauschen enthält, das die Performance des resultierenden Nowcasting-Ansatzes einschränkt.

ISBN: 978-3-96973-128-4

JEL-Klassifikation: C52, C53, C55, E37

Link zum Dokument