Dass es in der Fußballsprache von Phrasen nur so wimmelt, ist bekannt. Das gilt insbesondere für Spielberichte, wo die Phrasenhaftigkeit auch leicht erklärlich ist, schließlich müssen die Berichte schon kurz nach, am besten schon direkt zum Abpfiff geschrieben sein. Kein Wunder also, dass sich da allerhand Textroutinen einschleifen.

Gerade weil Spielberichte so stereotyp sind, eignen sie sich besonders gut für automatisierte Extraktion von Kollokationen. Phrasen Mining sozusagen. Kollokationen sind Wörter, die besonders häufig, genauer gesagt überzufällig häufig zusammen auftreten. Dabei nehmen die Wörter in genau dieser Kombination häufig eine andere oder zumindest spezifischere Bedeutung an als im freien Vorkommen und lassen sich auch nicht durch synonyme Ausdrücke ersetzen. So sagt man Abschied nehmen, aber Flucht ergreifen, obwohl man weder das eine noch das andere im wörtlichen Sinne nimmt oder ergreift.

Mit dem Ngram Statistics Package lassen sich solche Kollokationen vollautomatisch ermitteln, ohne dass man nach etwas bestimmtem suchen müsste. Das habe ich mit sämtlichen 3060 Bundesliga-Spielberichten der letzten zehn Spielzeiten von kicker.de ausprobiert und einen möglichst phrasendurchsetzten Durchschnittsspielbericht ausgerechnet.

Weiterlesen