Kursbeschreibung

Vor etwa zehn Jahren hat im Bereich der Wirtschaftswissenschaften die Anwendung von Textanalysemethoden zum Quantifizieren von verbaler Information angefangen. Im Bereich der Finanzwirtschaft war dabei das Papier von Tetlock (2007), das den Zusammenhang zwischen dem Ton einer täglich erscheinenden Zeitungskolumne und Aktienmarktrenditen analysiert, ein sehr einflussreiches Papier. In diesem Kurs werden die Teilnehmer lernen, wie Textanalyseverfahren funktionieren und wie man sie in Python implementiert.

Im ersten Teil des Kurses werden ausgewählte Papiere vorgestellt, anhand derer die verschiedenen Textanalyseverfahren und das grundsätzliche Vorgehen erläutert werden. Im zweiten Teil werden ausgewählte Datenquellen/Datenbanken, die häufig in textbezogenen Studien verwendet werden, präsentiert. Im dritten und größten Teil des Kurses lernen die Teilnehmer durch selbstständiges Programmieren in Python, wie man die in Teil 1 besprochenen Verfahren und die in Teil 2 besprochenen Datenquellen in der Praxis umsetzt.

Der Kurs setzt keine Vorkenntnisse im Bereich der Programmierung voraus. Teil 3 des Kurses startet mit einer grundlegenden Einführung in Python. Der Kurs richtet sich explizit auch an Teilnehmer, die nicht aus dem Bereich der Wirtschaftswissenschaften kommen. Ein Grundverständnis von wirtschaftlichen Zusammenhängen ist hilfreich, aber nicht erforderlich.

Für die Programmieraufgaben in Teil 3 wird ein Laptop oder Computer benötigt. Auf diesem sollte die Software „Anaconda“ installiert sein. „Anaconda“ bietet eine übersichtliche Benutzeroberfläche für Python und beinhaltet zudem Zusatzmodule für Python. Die Software ist kostenlos unter folgendem Link verfügbar: https://www.continuum.io/downloads. Für den Kurs ist zudem empfohlen Python Version 3.6 (und nicht 2.7) zu verwenden. „Anaconda“ steht sowohl als 32-bit als auch als 64-bit Version zur Verfügung.

Einstiegsliteratur:
Loughran, T., and B. McDonald (2016). Textual analysis in accounting and finance: A survey. Journal of Accounting Research, 54(4), 1187-1230.

 

Qualifikationsziel

Die Teilnehmer lernen folgende Verfahren in Python zu implementieren:

1. Automatisiertes Herunterladen von Texten/Dateien aus dem Internet

2. Aufbereiten und Durchsuchen von Textdokumenten, u.a. mit regulären Ausdrücken

3. Auf Wortlisten basierende Textanalysen

4. Berechnung von Maßen zur Lesbarkeit/Komplexität von Texten

5. Einstieg in maschinelles Lernen

Das Gesamtlernziel des Kurses ist, dass die Teilnehmer nach Abschluss des Kurses in der Lage sind, die unter Punkt 1 bis 5 erlernten Methoden auf ihren Forschungsbereich zu adaptieren und dort für ihre Fragestellungen anwenden können.