Der Livetickergenerator beruht auf 3060 part-of-speech-annotierten Bundesliga-Livetickern von kicker.de und weltfussball.de aus den Jahren 2006–2016. Die Füllelemente für die einzelnen Satzrahmen (erzieltes Tor, Fehlschuss, Torwartparade, Taktikbeschreibung, Spielbeschreibung, Trainerzitat und Verletzungsmeldung) wurden in CQP-basierten Abfragen erhoben und manuell bereinigt. Kein einziges Wort wurde nachträglich hinzugefügt, alles ist so in den originalen Livetickern zu finden und wird hier nur nach dem Zufallsprinzip neu kombiniert.

Das Script des Generators (mit reduzierten Füllwerten) kann hier eingesehen und für den eigenen Gebrauch heruntergeladen werden.

Derzeit läuft der Livetickergenerator in einer Austrian Edition mit den aktuellen Teams der österreichischen Bundesliga. Ein Dank an die Redaktion von ballesterer für Tipps bei der Anpassung an den österreichischen Fußballjargon.

Die vollständig annotierten Liveticker sind in den Korpora zur Fußballlinguistik öffentlich zugänglich, so dass die Erhebung der Füllwerte reproduziert werden kann. Es bieten sich etwa die folgenden Suchanfragen an:

"nach"%c [pos="ADJA"][pos="NN"]

[pos="VVFIN"][pos="ART"]

[lemma="Ball|Kugel|Pille|Rund|Leder|Kunstleder|Sportgerät|Ei"][pos="ADJD"]

[word=".*schuss"]

[pos="\$\,"][lemma="aber|doch"]

[pos="KOKOM"][pos="ADJA"]?[pos="NN"]

Auf GitHub sind außerdem die Scripte weltfussball_livetext.pl und kicker_livetext.pl verfügbar, mit denen die Korpora from the scratch selbst erstellt werden können.

Ausführlichere Informationen finden sich in diesem Blogpost.