An der Dresdner Langen Nacht der Wissenschaften 2020 hätte ich eigentlich einen Vortrag halten sollen zum Thema „Das Runde muss ins Eckige – Ein Streifzug durch die Sprache des Fußballs“. Geplant war ein launiger und interaktiver Vortrag mit anschließender Livedemonstration automatisierter Textgenerierung. Da aber die Lange Nacht coronabedingt ausfällt, habe ich den Vortrag in abgeänderter Form als YouTube-Video eingesprochen und gebe ihn ins Programm des Digitaltags 2020. Voilà, viel Spaß!
Schlagwort: Phrasen
Auftragsforschung galore! Über Twitter erreicht mich eine Anfrage von Eiserne Ketten, einem Taktikblog über den FC Union Berlin: Ob ich Daten über die Verwendungshäufigkeiten von „spielbestimmend“ und „das Spiel machen“ hätte. Habe ich natürlich, aber was wollen die Eisernen Ketten genau wissen? Ich vermute mal, ungefähr so etwas wie seinerzeit beim Ballbesitz, etwas diachrones also, und auf Nachfrage zeigen sie sich auch an den Kontexten interessiert. Na also, da kann ich liefern.
Eine schöne Textsorte der Fußballberichterstattung ist die Elf des Spieltages. Nach jedem Spieltag wird z.B. von von sportschau.de oder von goal.com ein Allstar-Team gekürt und jeder Spieler in einer kurzen Laudatio gerühmt. Praktischerweise sind diese Lobeshymnen nach Positionen sortiert und entsprechend gekennzeichnet, so dass diese Positionen in korpuslinguistischen Analysen als Metadaten in Form von xml-Attributen dienen können.
Seit ein paar Monaten sammle ich also Elf des Spieltages-Texte aus diesen beiden Quellen – 1056 Lobeshymnen aus 95 Spieltagen, insgesamt 48.000 Tokens. Mit statistischen Keyword-Analysen kann ich jetzt ausrechnen, welche Wörter etwa für Torwart-Texte typisch sind. Und da in diesen Texten erläutert wird, warum gerade dieser oder jene Spieler so herausragendes geleistet hat, dass er in die Elf des Spieltags aufgenommen wird, kann man aus diesen Wörtern Rückschlüsse auf die Erwartungen ziehen, die Journalisten typischerweise an das Spiel auf den jeweiligen Positionen herantragen. Eine halbautomatisierte Erwartungshaltungsanalyse also.
Ganz offenkundig sind Liveticker- und Spielberichtautoren fleißige Lehrbuchleser. Sonst wäre nicht ein immer wieder bemühtes Gütekriterium für Spielzüge aller Art, dass sie wie aus dem Lehrbuch oder lehrbuchmäßig seien. „Komparativer Phraseologismus“ hat man so etwas genannt, und vergleichbare Fälle aus der Fußballphrasenkiste wären wie ein Scheunentor, wie ein Hühnerhaufen oder wie eine Bahnschranke. Doch zurück zum Lehrbuch, das besonders häufig als Vergleich herangezogen wird, wie etwa hier in weltfussball.de-Livetickern:
Das müssen interessante und unterhaltsame Lehrbücher sein, denn sie beinhalten neben dem Standardkapitel zum Kontern auch so vielversprechende Kapitel wie „Die Abtastphase“, „Der No-Look-Pass“ oder auch „Effektiv-Fußball“. Selbst dem „Kaltstellen“ dürfte eine Passage gewidmet sein, deren genaue Lektüre hier dem Kölner Pedro Geromel zugeschrieben wird.
Eine (zugegeben flüchtige) Google Books Recherche in diversen Fußballlehrbüchern fördert aber zutage: Solche lustigen Lehrbücher gibt es nicht! Da überwiegen dann doch so schnöde Deskriptionen wie die, dass „nach einem schnellen Flügelwechsel der nun ballnahe Verteidiger zur anderen Seite verschiebt“, oder Ratschläge wie der, dass „bei der Anwendung einer Finte Spieler A deutlich täuschen soll, indem er den Täuschungsschritt weit seitlich nach vorne setzt“. Geht das nicht ein bisschen ansprechender?
Dass es in der Fußballsprache von Phrasen nur so wimmelt, ist bekannt. Das gilt insbesondere für Spielberichte, wo die Phrasenhaftigkeit auch leicht erklärlich ist, schließlich müssen die Berichte schon kurz nach, am besten schon direkt zum Abpfiff geschrieben sein. Kein Wunder also, dass sich da allerhand Textroutinen einschleifen.
Gerade weil Spielberichte so stereotyp sind, eignen sie sich besonders gut für automatisierte Extraktion von Kollokationen. Phrasen Mining sozusagen. Kollokationen sind Wörter, die besonders häufig, genauer gesagt überzufällig häufig zusammen auftreten. Dabei nehmen die Wörter in genau dieser Kombination häufig eine andere oder zumindest spezifischere Bedeutung an als im freien Vorkommen und lassen sich auch nicht durch synonyme Ausdrücke ersetzen. So sagt man Abschied nehmen, aber Flucht ergreifen, obwohl man weder das eine noch das andere im wörtlichen Sinne nimmt oder ergreift.
Mit dem Ngram Statistics Package lassen sich solche Kollokationen vollautomatisch ermitteln, ohne dass man nach etwas bestimmtem suchen müsste. Das habe ich mit sämtlichen 3060 Bundesliga-Spielberichten der letzten zehn Spielzeiten von kicker.de ausprobiert und einen möglichst phrasendurchsetzten Durchschnittsspielbericht ausgerechnet.