Der Livetickergenerator beruht auf 3060 part-of-speech-annotierten Bundesliga-Livetickern von kicker.de und weltfussball.de aus den Jahren 2006–2016. Die Füllelemente für die einzelnen Satzrahmen (erzieltes Tor, Fehlschuss, Torwartparade, Taktikbeschreibung, Spielbeschreibung, Trainerzitat und Verletzungsmeldung) wurden in CQP-basierten Abfragen erhoben und manuell bereinigt. Kein einziges Wort wurde nachträglich hinzugefügt, alles ist so in den originalen Livetickern zu finden und wird hier nur nach dem Zufallsprinzip neu kombiniert.

Das Script des Generators (mit reduzierten Füllwerten) kann hier eingesehen und für den eigenen Gebrauch heruntergeladen werden.

Aus Anlass der Jahrestagung 2019 des Mannheimer Instituts für Deutsche Sprache (IDS) läuft derzeit eine Sonderedition, in der germanistische Linguist*innen in Uniteams gegeneinander antreten.

Die vollständig annotierten Liveticker sind in den Korpora zur Fußballlinguistik öffentlich zugänglich, so dass die Erhebung der Füllwerte reproduziert werden kann. Es bieten sich etwa die folgenden Suchanfragen an:

"nach"%c [pos="ADJA"][pos="NN"]

[pos="VVFIN"][pos="ART"]

[lemma="Ball|Kugel|Pille|Rund|Leder|Kunstleder|Sportgerät|Ei"][pos="ADJD"]

[word=".*schuss"]

[pos="\$\,"][lemma="aber|doch"]

[pos="KOKOM"][pos="ADJA"]?[pos="NN"]

Auf GitHub sind außerdem die Scripte weltfussball_livetext.pl und kicker_livetext.pl verfügbar, mit denen die Korpora from the scratch selbst erstellt werden können.

Ausführlichere Informationen finden sich in diesem Blogpost.