N-Gram | Diskursmonitor

Das DiskursBarometer bietet einen datengestützten, quantifizierenden Einblick in die aktuelle sprachliche und diskursive Großwetterlage. Für dieses automatische Monitoring werden täglich tausende Texte aus öffentlich zugänglichen Online-Portalen erfasst, computerlinguistisch aufbereitet und mithilfe von Text-Mining-Verfahren ausgewertet. Langfristiges Ziel ist, Metriken zu entwickeln und bereitzustellen, die bestimmte Facetten diskursiver Dynamiken in Abhängigkeit von Zeitverlauf, Medien, AutorInnen u.a. hinweg abbilden. Nähere Erläuterungen finden Sie in einem Hintergrund-Dossier.

Sample von 1000 zentralen 5-Grammen der letzten drei Tage LIVE-Korpus

N-Gramme sind hoch frequente Wortfolgen und gehören zur Analysekategorie der Mehrworteinheiten. Das N steht dabei für eine natürliche Zahl größer 0 (hier: ist N=5, wobei das zentrale Gram, dem Suchwort entspricht). Geben Sie einen Suchbegriff ein und bestätigen Sie ihre Eingabe mit einem Klick auf den Button (eine Mehrworteingabe ist möglich – die Worte sollten dann aber in häufiger Folge möglichst nah (innerhalb von +/- 5 Token) in möglichst vielen Sätzen vorkommen). Das DiskursBarometer zieht dann eine Stichprobe von bis zu 1000 Belegen, ermittelt die zentralen 5-Gramme zum Suchwort und stellt die Ergebnisse als Graph dar. Token werden als Knoten/Kreise dargestellt. Hellblaue Token stehen vorwiegend an Position (-2), also vor dem Suchwort, Blaue an (-1), Rote an (+1) – also nach dem Suchwort und rosa Token (+2) bilden den Abschluss des 5-Gramms. Die einzelnen Knoten sind mit Kanten/Linien verbunden. Je größer ein Knoten, oder eine Kante desto häufiger kommt dieser in der Stichprobe vor. Kanten werden in der Farbe des Zielknotens eingefärbt. Bewegen Sie die Maus über Knoten und Kanten, um entsprechende Informationen anzuzeigen. Kanten mit einer besonders hohen Frequenz werden gelegentlich derart breit dargestellt, dass Sie als Fläche/Rechteck erscheinen. Nutzen Sie das Mausrad, um in die Grafik zu zoomen.