Krisen und Katastrophen – im Gegensatz zur normalen Welt da draußen sind das im Fußball ganz normale, absolut erwartbare, ja geradezu alltägliche Ereignisse. Zumindest wenn man den Akteur*innen wie Spieler*innen, Trainer*innen und auch den berichtenden Journalist*innen glauben mag. Bekanntlich können schon zwei sieglose Spiele der Bayern ausreichen und schon stecken sie in einer handfesten Krise. Und ein frühes Gegentor kann auch dann eine Katastrophe sein, wenn man das Spiel noch erfolgreich drehen kann.
WeiterlesenSchlagwort: Kollokationen
In einem früheren Blogpost habe ich eine korpuslinguistische Methode zur automatisierten Detektion von ‚Phrasen‘ vorgestellt. Die basiert auf einer sog. Kollokationsanalyse und funktioniert kurz gesagt so, dass in einem Korpus Wortpaare gefunden werden, deren Bestandteile für sich genommen selten, dafür aber recht häufig zusammen vorkommen (und zwar im statistischen Sinne signifikant häufig). Thematisch homogene Korpora wie etwa Liveticker-Korpora sind hierfür ideal, denn wenn bspw. in Livetickern überhaupt von einer Messe die Rede ist, dann wohl immer in der Weise, dass sie (noch nicht) gelesen ist. Der Phrasendetektor findet also Wortverbindungen, deren Komponenten in ihrer wörtlichen Bedeutung thematisch nicht einschlägig sind, dafür aber in genau dieser Kombination idiomatische Bedeutung haben und als Idiome wiederum sehr domänentypisch sind.
WeiterlesenAuftragsforschung galore! Über Twitter erreicht mich eine Anfrage von Eiserne Ketten, einem Taktikblog über den FC Union Berlin: Ob ich Daten über die Verwendungshäufigkeiten von „spielbestimmend“ und „das Spiel machen“ hätte. Habe ich natürlich, aber was wollen die Eisernen Ketten genau wissen? Ich vermute mal, ungefähr so etwas wie seinerzeit beim Ballbesitz, etwas diachrones also, und auf Nachfrage zeigen sie sich auch an den Kontexten interessiert. Na also, da kann ich liefern.
Dass es in der Fußballsprache von Phrasen nur so wimmelt, ist bekannt. Das gilt insbesondere für Spielberichte, wo die Phrasenhaftigkeit auch leicht erklärlich ist, schließlich müssen die Berichte schon kurz nach, am besten schon direkt zum Abpfiff geschrieben sein. Kein Wunder also, dass sich da allerhand Textroutinen einschleifen.
Gerade weil Spielberichte so stereotyp sind, eignen sie sich besonders gut für automatisierte Extraktion von Kollokationen. Phrasen Mining sozusagen. Kollokationen sind Wörter, die besonders häufig, genauer gesagt überzufällig häufig zusammen auftreten. Dabei nehmen die Wörter in genau dieser Kombination häufig eine andere oder zumindest spezifischere Bedeutung an als im freien Vorkommen und lassen sich auch nicht durch synonyme Ausdrücke ersetzen. So sagt man Abschied nehmen, aber Flucht ergreifen, obwohl man weder das eine noch das andere im wörtlichen Sinne nimmt oder ergreift.
Mit dem Ngram Statistics Package lassen sich solche Kollokationen vollautomatisch ermitteln, ohne dass man nach etwas bestimmtem suchen müsste. Das habe ich mit sämtlichen 3060 Bundesliga-Spielberichten der letzten zehn Spielzeiten von kicker.de ausprobiert und einen möglichst phrasendurchsetzten Durchschnittsspielbericht ausgerechnet.