Das famose Fußballmagazin ballesterer, das sich der „offensiven Erweiterung des Fußballhorizonts“ verschrieben hat, bringt im neuen Heft ein kurzes Interview mit mir zum Livetickergenerator. Natürlich habe ich eigentlich viel mehr gesagt (und wurde auch mehr gefragt), als nun letztlich abgedruckt wird. Und da ich das Interview via Email gegeben habe, nutze ich hier die Chance, um es hier in voller Länger abzudrucken:

Wie kamen Sie auf die Idee für den Bot?

Bei der computerlinguistischen Analyse von Texten der Fußballberichterstattung ist mir aufgefallen, dass es eine recht begrenzte Menge von Satzschablonen gibt, die immer wieder verwendet werden und in die nur immer andere Füllwerte eingesetzt werden. Die Schablone „Spieler xy schießt den Ball ins Tor“ wird etwa durch Adjektive wie „beherzt“, „eiskalt“, „sehenswert“ usw. ergänzt, und statt „schießen“ wird „dreschen“, „hämmern“, „spitzeln“ usw. eingesetzt. Welche Wörter hier zur Verfügung stehen, kann man computerlinguistisch leicht ermitteln. Und da lag es nahe, den Schreibprozess vom Computer simulieren zu lassen, also die Satzschablonen zufallsbasiert zu füllen. Eigentlich hatte ich eine Homepage geplant, wo man wählen kann, welche Teams gegeneinander antreten, und dann wird ein ganzer Liveticker generiert. Aber das hätte ja kaum ein User mehr als zwei dreimal gemacht. Der Bot liefert dagegen regelmäßig in kleinen Häppchen, und so wird es ja auch gut angenommen.

Warum ausgerechnet der kicker als Quelle?

Einerseits funktioniert die Ermittlung der nötigen Daten hier besonders gut, weil in kicker-Livetickern besonders vielfältige Füllwerte verwendet werden. Die Adjektivpalette zum Beispiel ist hier viel breiter als bei vielen Konkurrenzanbietern. Andererseits ist der kicker-Liveticker wahrscheinlich der berühmteste, und ich hänge mich in den Windschatten, um auch mein Projekt bekannter zu machen. Schließlich liegt es auch an dem für Computerlinguisten sehr dankbaren Content Management System, das die beim kicker verwenden, denn man kann die Daten ganzer Jahrgänge problemlos automatisiert extrahieren und weiterverarbeiten.

Gibt es etwas, dass an der Fußballsprache linguistisch besonders interessant ist?

Aber sicher, es werden aber alle Linguistinnen und Linguisten etwas anderes herauspicken, was sie besonders interessiert. Die Bildhaftigkeit, die vielen charakteristischen Metaphern und Redewendungen, wie z.B. das wunderbare „sich in die Torschützenliste eintragen“, sind in vielen Analysen beschrieben worden. Mich persönlich interessiert eben die Schablonenhaftigkeit, das Routinehafte in den Satzmustern, das durch einen besonders vielfältigen Wortschatz trotzdem wieder lebendig gemacht wird. Dieser Fußballwortschatz erlaubt es, bei der Beschreibung von Spielzügen die allerfeinsten Nuancierungen vorzunehmen, da steht die Fußballsprache etwa der Sprache der Önologie, also der Beschreibung von Wein, in nichts nach.

Gibt es etwas an der Sprache des Sportjournalismus, was Sie als Linguist besonders stört bzw. was nach Ihrer Auffassung besser gemacht werden müsste?

Eigentlich soll ruhig alles so bleiben, wie es ist, sonst wäre ich arbeitslos. Aber im Ernst: Das Phrasenhafte, so interessant für mich als Linguist auch ist, geht mir als Leser natürlich schon oft auf die Nerven. Wenn immer wieder die gleichen Metaphern wie „im Strafraum brennt es lichterloh“ oder „beide Mannschaften spielen mit offenem Visier“ kommen, dann würde ich mir manchmal mehr Variation wünschen. Die Frage ist aber, ob Liveticker und Spielberichte, die unter größtem Zeitdruck geschrieben werden, das überhaupt leisten können. Was mich dagegen wirklich stört, ist die Art, wie Trainer- und Spielerzitate in der Sportberichterstattung weiterverbreitet werden. Das sind zu 95% nichtssagende und die üblichen Erwartungen an Leistungswille und Teamplay bedienenden Phrasen. Dass die wirklich so wenig zu sagen haben, glaube ich nicht, man müsste dem eben einfach mal mehr Raum geben.

Eignet sich die Fußballsprache besonders für die Computergenerierung?

Kurzum: Ja! Je schablonenhafter die Texte sind, desto leichter lassen sie sich automatisiert erstellen. Vollautomatisierte Spielberichte gibt es ja schon, und wenn man damit nicht rechnet, merkt man es nicht, dass die ein Computer geschrieben hat. Mit den ganzen Livedatenstreams, die Agenturen wie Opta anbieten, wo jede Ballberührung, jeder gelaufene Schritt in Echtzeit erfasst wird, wird es auch nicht mehr lange dauern, bis auch echte Liveticker in akzeptabler Qualität computergeneriert werden.

Was ist das Ziel des Projekts?

Vor allem soll es Spaß machen. Viele der Follower des Bots freuen sich regelrecht darüber, wenn der Generator einen Tweet über einen Spieler oder Ex-Spieler ihres Clubs ausspuckt, oder reagieren empört, wenn es über einen ihrer Lieblingsspieler heißt, dass er „in der Abwehr hängen bleibt“ oder so. Das Spiel wird weitergespielt, und das freut mich. Aber natürlich will ich mit dem Bot auch zeigen, wie vorhersagbar die Sprache der Fußballberichterstattng ist, wenn es so einfach ist, vollkommen zufallsbasiert Meldungen zu generieren, die kaum wie Nonsense wirken. Und schließlich nutze ich das auch als Aushängeschild für mein Fach. Linguistik steht ja oft in dem Ruf, trocken und auch ein bisschen kleinkariert zu sein. Mit dem Bot zeige ich, dass man mit linguistischen Methoden auch lustige Dinge anstellen kann.

Wie lange geht es schon?

Mit der Datensammlung und -auswertung habe ich 2016 angefangen, der Bot selbst läuft aber erst seit Oktober 2017.