Hintergrund-Dossier | Diskursmonitor

Das DiskursBarometer bietet einen datengestützten, quantifizierenden Einblick in die aktuelle sprachliche und diskursive Großwetterlage. Für dieses automatische Monitoring werden täglich tausende Texte aus öffentlich zugänglichen Online-Portalen erfasst, computerlinguistisch aufbereitet und mithilfe von Text-Mining-Verfahren ausgewertet. Langfristiges Ziel ist, Metriken zu entwickeln und bereitzustellen, die bestimmte Facetten diskursiver Dynamiken in Abhängigkeit von Zeitverlauf, Medien, AutorInnen u.a. hinweg abbilden. Nähere Erläuterungen finden Sie in einem Hintergrund-Dossier.

Zum wissenschaftlichen Ansatz des DiskursBarometers

Das DiskursBarometer wird als freie Softwareplattform (OpenSource) zur Analyse großer Diskursformationen entwickelt. Ziel ist primär die Analyse dynamischer Korpora (täglich erfasster Texte) als auch der sekundäre Vergleich mit statischen Korpora (abgeschlossen und unter kontrollierten Bedingungen erstellt). Die Korpuszusammenstellung umfasst eine breite Palette öffentlicher deutschsprachiger Kommunikation und Fachdomänen. Dies schließt sowohl Zeitungstexte, Plenarprotokolle, Drucksachen der Legis- und Judikative, als auch verschiedene Onlinemedien und Präsenzen von Lobbyorganisationen mit ein (weitere Quellen sind angedacht und in Vorbereitung). In der ersten Testphase wurden pro Tag zwischen 15-20 Tausend Dokumente erfasst. Derartige Mengen von Texten lassen sich nur noch mittels Text-Mining erheben und auswerten. Neben der Anwendung von etablierten Methoden (wie z. B. der Analyse von Schlagworten, Frequenz- und Kookkurrenzanalysen) werden neuartige Ansätze zur Erforschung maschineller Auswertungen von Diskursen entwickelt. Hierzu zählen vor allem quantifizierende „Diskursmetriken“, die Veränderungen typisierbarer sprachlicher Diskursstrukturen über die Zeit hinweg sichtbar machen: den Grad an argumentativer Kontroverse und Agonalität (Kontroversen- bzw. Konfliktmetrik), den Grad an thematischer, ausdrucksseitiger und quellenbezogener Homogenität (Homogenitätsindex), epistemischer Gewissheit (Spekulationsindex), den Grad an Emotionalisierung und sprachlicher Empörung, De-Agentivierung und Retrospektivität.

Die Entwicklung einer Theorie und Methode der hermeneutischen Diskursmetrisierung steht noch am Anfang und ist Gegenstand aktueller Studien in der Siegener Forschungsgruppe „Computergestützte Sozio- und Diskurslinguistik“ (CoSoDi). Die Herausforderung besteht darin, rein deduktive, auf Listen von Autosemantika basierende Verfahren einschließlich der damit verbundenen methodischen Probleme zu überwinden und mit induktiven Ansätzen zu kombinieren. Zu diesem Zweck greifen wir auch zurück auf empirisch entwickelte Ergebnisse der funktionalen Grammatik insb. zu Synsemantika, eigene qualitative und quantitativ informierte Diskursanalysen sowie auf eine multivariate Vorberechnung von korpusspezifischen Sprachgebrauchsmustern.

Da hierzu noch viele Fragen offen sind, wird das Barometer in der ersten Projektphase nur sukzessive Metriken und Analysen bereitstellen (z. B. Informationen zur Korpuszusammenstellung, grundlegende Frequenzmetriken, Schlagwörter). Webseitenbesucher*innen können in vordefinierten, dynamischen Visualisierungen erste Erfahrungen mit der Plattform sammeln. Dies gibt bei der Entwicklung der Plattform die Möglichkeit, frühzeitiges Feedback und Wünsche der Fachcommunity einzuholen. Die zweite Projektphase wird eine größere Interaktivität bieten und direkte, datenintensive Werkzeuge für Forscher*innen bereitstellen. Komplexere Analysen, die auch mehrere Stunden bis Tage zur Berechnung benötigen, können über die Plattform erstellt werden. Ebenso lassen sich Analysen mit Berichtsfunktionen verknüpfen, z. B. können sich Nutzer*innen bei einem starken Anstieg der thematischen Varianz (oder anderer Metriken) automatisch benachrichtigen lassen.

Bei passenden DiskursGlossar-Einträgen sollen automatisierte Analysen zum gegenwärtigen (dynamisch) oder vergangenen (statisch) Diskursereignissen eingebunden werden. So ist z. B. geplant, dass im DiskursGlossar aktuelle Schlagwörter im Live-Korpus angezeigt werden und dass über die Interaktivität der Visualisierung eine praktische Nutzbarkeit der im Glossareintrag beschriebenen Analysekategorie sichtbar wird. Umgekehrt basieren viele Metriken des DiskursBarometers auf verschiedenen Methoden, die im DiskursGlossar ausgeführt werden.

Insbesondere ab der zweiten Projektphase – wenn die Methoden für Expert*innen fertiggestellt sind – erlaubt das DiskursBarometer die direkte Einbettung von Analysen in die Beiträge der DiskursReview. Leser*innen der DiskursReview-Beiträge können so Analysen an realen Daten nachvollziehen und auch mit eigenen Parametern experimentieren (ähnlich dem Konzept von Jupyter Notebooks).

Das DiskursBarometer wird mit einem Fokus auf hohe Benutzerfreundlichkeit entwickelt. Die Dokumentation, insbesondere auch im Hinblick auf die Einbindung in die Lehre, erfolgt nach und nach in Tutorials und Hands-on Labs in der DiskursWerkstatt. Studierende sollen so bei der Realisierung eigenständiger Forschungsprojekte unterstützt werden. Bestehende empirische Analyse-Tools bieten hier zwar bereits einige gute Funktionen, jedoch verfügt keine der gegenwärtigen Online-Plattformen über eine Auflösung von Diskursformationen auf Tagesbasis (in der Regel nur grob auf Basis von Jahren).

Weitere Informationen zur hier verwendeten Software- und Serverarchitektur finden Sie in einem eigenen Artikel zum technischen Hintergrund.

Ansprechpartner

Dr. Jan Oliver Rüdiger: diskursbarometer@jan-oliver-ruediger.de