Das DiskursBarometer bietet einen datengestützten, quantifizierenden Einblick in die aktuelle sprachliche und diskursive Großwetterlage. Für dieses automatische Monitoring werden täglich tausende Texte aus öffentlich zugänglichen Online-Portalen erfasst, computerlinguistisch aufbereitet und mithilfe von Text-Mining-Verfahren ausgewertet. Langfristiges Ziel ist, Metriken zu entwickeln und bereitzustellen, die bestimmte Facetten diskursiver Dynamiken in Abhängigkeit von Zeitverlauf, Medien, AutorInnen u.a. hinweg abbilden. Nähere Erläuterungen finden Sie in einem Hintergrund-Dossier.
Sentiment-Analyse des LIVE-Korpus mittels SentiWS
Sentiment-Analysen (Sentiment von engl. Gefühl/Empfindung) sind in Big-Data- und computerlinguistischen Analysen weit verbreitet. Für derartige Analysen werden zunächst Wortlisten erstellt. Dies kann z. B. auf Basis bestehender Korpora geschehen, indem das Material manuell annotiert wird. Textstellen oder Ausdrücke werden dabei in Kategorien wie positiv oder negativ eingeteilt. Diese Wortlisten dienen dann dazu, neues Textmaterial zu bewerten. Enthält ein zu bewertender Text wesentlich mehr Begriffe von der Negativ-Liste als von der Positiv-Liste, dann wird er mutmaßlich von negativen Emotionen dominiert. Doch dieses Verfahren hat methodische Grenzen und ist daher nur unter Vorbehalt einsetzbar: Zum einen fixiert das Verfahren die Textoberfläche und erkennt Tiefenstrukturen, Kontexte, Ironie und ähnliche sprachliche Phänomene nicht; zum anderen ist die Erstellung der Ausgangslisten und damit Bewertung von Einzeläußerungen oftmals von der subjektiven Einordnung des/der Bearbeiter/in abhängig. Daher betrachten wir dieses Verfahren im Rahmen des DiskursBarometers als eine sehr grobe Übersichtsmetrik, die lediglich einen Anfangsverdacht liefern kann. Diesem Anfangsverdacht kann und muss dann mit anderen Analyseverfahren nachgegangen werden. Die auf der Zeitachse mit Ausrufezeichen („!“) hervorgehobenen Datenpunkte sind dabei auffällige Unregelmäßigkeiten (starke Abweichung allgemein, gegenüber allgemeinem Trend, gegenüber einem saisonalen Trend). Wir verwenden für die folgende Analyse (letzten 60 Tage) das von [Remus, R., et al.] erstellte Sentiment-Modell.
Literaturverzeichnis
http://www.lrec-conf.org/proceedings/lrec2010/pdf/490_Paper.pdf.