(Almost) Open Data

Die Daten, die ich in den Korpora zur Fußballlinguistik zur für Forschungszwecke zur Verfügung stelle, sind urheberrechtlich geschützt. Deshalb können sie in CQPweb zwar recherchiert, nicht aber heruntergeladen werden. Inzwischen haben sich schon zahlreiche Linguist_innen aus ganz Europa für die Korpora registriert, um mit diesen Daten ihre eigenen Fragestellungen bearbeiten zu können. Dabei sind sie aber auf den Funktionsumfang von CQPweb angewiesen, der nicht schlecht ist aber eben doch besser sein könnte.

Und wenn ich schon die Daten selbst nicht teilen kann, so will ich doch wenigstens die Hürden senken, die an der Fußballsprache Interessierte daran hindern können, sich einfach selbst die Daten zu besorgen (was, solange man sie nicht wiederum weiterverbreitet, auch erlaubt ist). Noah Bubenhofer demonstriert auf seiner Seite eine Kombination aus curl, wget und xslt, mit der man sich die Daten runterladen und aufbereiten kann. Das funktioniert gut, und ich empfehle allen, es selbst zu lernen. Noch einfacher ist es aber mit den Standalone-Skripts, die ich seit heute auf GitHub zur Verfügung stelle. In den Skripts müssen nur die Start-URL und der Pfad für die Output-File angepasst werden, und schon lädt einem das Skript Liveticker und Spielberichte ganzer Spielzeiten oder Turniere herunter und gibt sie als saubere xml-Dateien aus.

Für den Import in die Corpus Workbench oder die niedrigschwellige Analyse mit AntConc o.ä. ist noch ein weiterer Transformationsschritt nötig, der die Metadaten als xml-Attribute ausgibt. Entsprechende xsl-Stylesheets sind auf GitHub ebenfalls verfügbar.

Weiterlesen

Goals from the past

Meine Fußballkorpora sind, wenn man so will, historische Korpora. Schließlich sind die meisten der enthaltenen Texte so gegenwartsorientiert, dass man sie schon eine Woche nach ihrem Entstehen eigentlich nur noch aus einem historischen Interesse heraus lesen würde.

Nun spielen aber in der Fußballberichterstattung, auch wenn sie selbst möglichst aktuell sein muss, historische Rückblenden ohnehin eine wichtige Rolle. Kaum eine Vorberichterstattung kommt aus ohne die oft pathetisch aufgeladenen Rückblicke auf die letzten Aufeinandertreffen sich nun abermals duellierenden Mannschaften. Selbst in Liveticker-Apps wie FotMob werden zu jedem Match unter der Bezeichnung „Head to Head“ die vergangenen Begegnungen mitgeliefert. Und auch die so gerne angeführten „Statistiken“ wie „seit so und so vielen Partien nicht mehr dieses oder jenes“ stellen das gegenwärtige Geschehen in den Lichtkreis des Vergangenen.

Zusammen mit Jürgen Hermes, einem Digital Humanist und fleißigen Twitterer aus Köln, habe ich nun für die kommende WM ein Projekt gestartet (bzw. aufgehübscht und fortgesetzt), in dem wir diesen Vergangenheitsbezug der Fußballberichterstattung auf eine nette Weise inszenieren und zelebrieren wollen. Der Twitter-Account @retrolivetext wird zu den Spielen, die im Zeitalter der Liveticker (also ab 2002) schon einmal stattgefunden haben, die alten Tickermeldungen zeitlich parallel nochmals in den Äther schicken. Über die technischen Hintergründe (ich habe die Daten geliefert, die Programme zur automatisierten Auslesen und Aufbereiten für Twitter hat Jürgen Hermes geschrieben), aber auch zum gesellschaftstheoretischen Überbau des Projekts informiert ausführlich dieser Blogpost.

Wie sehr das Vergangene gegenwärtig ist bzw. gemacht wird, wird sich dann zeigen, wenn z.B. während der Vorrundenpartie Deutschland gegen Schweden Lukas Podolski seine linke Klebe auspackt…

Ein Update für den Livetickergenerator

Seit gut einem halben Jahr spuckt der Livetickergenerator 11 mal täglich zufallsgenerierte Livetickermeldungen in die Twittersphere. Und auch wenn die Summe der Kombinationsmöglichkeiten die Menge der bisher abgesetzten Tweets um ein vielfaches übertrifft, macht sich langsam Langeweile breit. Zeit also für ein Update, und was wäre hierfür ein besserer Anlass als die anstehende WM?

Die WM-Edition des Livetickergerators, die am 31. Mai ihren Dienst aufgenommen hat, wartet mit folgenden Änderungen auf:

  • Die Daten stammen von weltfussball.de (und sind ebenfalls über die Korpora zur Fußballlinguistik frei zugänglich).
  • Die Namen von Spielern und Trainern sind jetzt brandaktuell, sind also den offiziellen Kaderlisten entnommen, wie sie der FIFA gemeldet wurden.
  • Die Spielernamen werden deshalb auch nicht völlig frei, sondern den Teams und matchweisen Gegnerschaften entsprechend kombiniert.
  • Jedem Tweet wird ein Hashtag mit den beiden Ländercodes der beteiligten Mannschaften beigegeben.

Bestehen bleibt dagegen dass Prinzip, dass der Livetickergenerator nichts erfindet, sondern nur authentische Meldungen in Chunks auftrennt und diese dann neu kombiniert. Glichen aber die bisherigen Meldungen der Dante’schen Vorhölle, wo sich Spieler zum Austausch von Doppelpässen begegneten, die im wahren Leben nie zusammen gespielt haben, sind die neuen Meldungen eher Ausdruck einer Realutopie, in der auch die zweiten und dritten Torhüter der aktuellen Kader ihre Chance bekommen.

Außerdem wurden dank neu erworbener Programmierkenntnisse, die eine viel flexiblere und verschachtelte Rekombination erlauben, die Paradigmen der einzelnen Chunks um ein vielfaches erweitert. Auch die in der Erstfassung noch eingehaltene 140-Zeichen-Grenze ist längst gefallen, so dass auch solche Perlen möglich werden:

Nach atemberaubendem Direktspiel flankt Eduardo Salvio das Kunstleder rüde zu Gabriel Mercado, der aber kann den Ball nur verlängern und so hat Marc-André ter Stegen die Kugel ganz schnell in seinen Händen. #ARGGER

Säbeln, dreschen, schlumpfen – ein interaktives Netzwerk

Der vielgerühmte Reichtum der Fußballsprache an Quasisynonymen ist nirgends so groß wie im Bereich der Verben für die verschiedenen Arten des Schießens. Das liegt nicht nur daran, dass es so viele verschiedene Schusstechniken gibt. Zwar mag man zwischen lupfenchippen und schieben anhand der exakten Bewegung von Spieler und Ball gut unterscheiden können, aber der Unterschied zwischen hämmernnageln, dreschen und zimmern dürfte überall, nur nicht in den damit bezeichneten Akten des Schießens zu suchen sein.

Ein wirksames Prinzip in Livetickern scheint neben dem ohnehin geltenden Gebot zur ständigen Variation (die Spieler wemmsen eben, wenn sie zuvor genagelt haben) auch das der, wie ich es nennen möchte, stilistischen Isotopie zu sein. Expressive Jargonverben werden eher mit zusammen mit anderen Jargonausdrücken kombiniert, weshalb eher das Leder in die Maschen gezimmert, der Ball dagegen eher in die Mitte gespielt wird.

Außerdem gibt es auch anbieterspezifische Unterschiede. Der Kicker-Liveticker hat andere Verben in petto als etwa der von sportal.de – und besonders extravagant ist sicher der von 11 Freunde. Um sich die ganze Bandbreite der Verben wie auch die anbieterspezifischen Vorliegen mit einem Mal zu vergegenwärtigen, bietet sich eine Visualisierung in Form eines Netzwerks an. Eine smartphonetaugliche Variante bette ich direkt hier ein, für alle Desktopnutzenden empfehle ich diese interaktive Variante.

Das Netzwerk zeigt alle lemmatisierten Füllwerte der Konstruktion VVFIN {den | die | das} {Ball |Ei | Kugel | Kunstleder | Leder | Murmel | Pille | Rund | Spielgerät | Sportgerät} aus den Livetickern von kicker.de, sportal.de, weltfussball.de und 11freunde.de, insgesamt 185 Stück. Dabei wurden nur Troponyme für schießen berücksichtigt, Torwartverben wie fausten und nonagentive Verben wie landen habe ich bereinigt. Die Kanten im Netzwerk zeigen, in welchen Livetickern (repräsentiert durch die grünen Knoten in der Mitte) sie verwendet werden. Der verwendete Algorithmus zur Berechnung des Netzwerks geht so vor dass Knoten mit vielen Ein- und Ausgängen weiter innen stehen, so dass Verben, die in allen Livetickern zu finden sind, eher in der Mitte stehen, die idiosynkratischen dagegen eher außen. Ein Nebeneffekt davon ist der, dass man aus der Position der Website-Knoten zueinander ersehen kann, wie ähnlich sich ihre Verbparadigmen sind. Wenig überraschend zeigt sich, dass die konventionellen, vor allem auf Information abstellenden Liveticker von kicker.de, sportal.de und weltfussball.de ein Grüppchen bilden und der Liveticker von 11freunde.de eher abseits steht. In der interaktiven Variante kann man die einzelnen Knoten anklicken und sich alle Verbindungen anzeigen lassen, so dass man auf einen Blick die Verben sieht, die in einem der Liveticker verwendet werden, oder aber, in welchen Livetickern ein Verb verwendet wird.

In reinen Zahlen ausgedrückt verteilen sich die Verbparadigmen auf die vier Anbieter wie folgt:

Anbieter Types Tokens häufigste Types
kicker.de 80 8773 bringen, lenken, jagen
sportal.de 76 5363 bringen, spielen, legen
weltfussball.de 115 20173 bringen, setzen, legen
11freunde.de 126 663 schieben, köpfen, zimmern

Mein Liebling ist übrigens buttercremen. Und zum Beweis, dass ich mir das nicht ausdenke:

Tschongs für den BVB. Blaszcdingsbums buttercremt den Ball in die Mitte. Aber Lewandowsi kommt etwas zu spät. Das war knapp. Aber knapp vorbei ist eben immer auch irgendwie schmerzhaft.

Evolution der Formationen

Eines der grundlegenden Verfahren der Beschreibung von Fußballtaktik ist die Bestimmung von Spielformationen, jenen schematischen Anordnungen der Spieler einer Mannschaft auf dem Feld, die typischerweise als Zahlenkombinationen angegeben werden. Zwar sagt die Formation selbst noch wenig darüber aus, wie eine Mannschaft tatsächlich spielt, aber sie disponiert eben doch für bestimmte taktische Ausrichtungen und wird deshalb in Taktikanalysen gerne als Beschreibungs- und Erklärungsmittel eingesetzt.

Das gilt für die Mainstream-Presse wie die Spielberichte auf kicker.de, und es gilt natürlich noch mehr für die kenntnisreichen Taktikanalysen auf Taktikblogs wie spielverlagerung.de, wo eigentlich kaum eine Analyse ohne diese Zahlenspiele auskommt. In Zahlen: Von 3060 Bundesliga-Spielberichten (2006–2016) von kicker.de werden in gerade einmal 160 Spielberichten solche Zahlenkombinationen genannt, bei einer relativen Häufigkeit von 106 pro Mio. Tokens. Bei spielverlagerung.de dagegen sind sie  in 1.575 von insgesamt 1.684 Texten zu finden, und die relative Häufigkeit ist mit 3.584 pro Mio. Tokens mehr als dreißig Mal so hoch.

Weiterlesen

Ein Interview zum Livetickergenerator

Das famose Fußballmagazin ballesterer, das sich der „offensiven Erweiterung des Fußballhorizonts“ verschrieben hat, bringt im neuen Heft ein kurzes Interview mit mir zum Livetickergenerator. Natürlich habe ich eigentlich viel mehr gesagt (und wurde auch mehr gefragt), als nun letztlich abgedruckt wird. Und da ich das Interview via Email gegeben habe, nutze ich hier die Chance, um es hier in voller Länger abzudrucken:

Weiterlesen

Wider die Erwartbarkeit – Zur Wahl des Fußballspruchs des Jahres 2017

Fußball wird nicht nur gespielt, über Fußball wird auch geredet und geschrieben. Und das so ausdauernd und ausführlich, dass sich zweifellos eine eigene Fußballsprache herausgebildet hat. Die schönste Nebensache der Welt wäre ja auch nicht halb so schön, wenn man nicht eine Sprache hätte, die, wie es der Linguist Armin Burkhardt ausdrückt, eine treffende und zugleich gruppenintegrative Kommunikation über den Sport erlauben würde. Fußballfans wissen, was eine Bogenlampe oder ein Staubsauger ist und wo der lange Pfosten steht. Was Mannschaften tun, wenn sie sich abtasten, und warum Torhüter mitunter Kirschen pflücken, all das wissen Fußballfans – und die anderen eben nicht. Und das ist ja gerade der Witz an der Sache: Eher Spezialbedeutungen bekannter Wörter als Spezialausdrücke, eher besondere Verwendungsweisen als Fachterminologien prägen die Fußballsprache und machen sie zu einer Art symbolischem Spielfeld innerhalb der Standardsprache, wo eben andere Spielregeln gelten und die all die zusammenbringen, die nach ihnen zu spielen vermögen.

Weiterlesen

Ich baue mir einen Livetickergenerator

Livetickerautoren müssen vor allem schnell sein. Da bleibt keine Zeit für das Feilen an Formulierungen. Kein Wunder also, dass sie auf vorgefertigte Phrasen zurückgreifen, die dann nur noch an einzelnen Stellen variiert werden müssen. Wer Liveticker liest, erkennt bald die Formulierungsroutinen, die immer wieder herhalten müssen, und wer viele Liveticker liest, kennt auch bald die ganzen Varianten, denen zufolge mal die Pille, mal die Kugel, mal das Leder in die Maschen, das Netz oder über die Linie gedroschen, gehämmert und genagelt wird.

In England ist man vielfach sogar so konsequent, das Tickerschreiben gleich ganz den Maschinen zu überlassen. Die Ergebnisse sind aber dürftig, denn der Computer hat kein Stilbewusstsein (oder die, die ihn programmierten, haben keines). Der BBC-Liveticker etwa stört sich auch nicht an allerauffälligsten Wiederholungen:

88′ Offside, Brighton and Hove Albion. Mat Ryan tries a through ball, but Glenn Murray is caught offside.

88′ Offside, Arsenal. Rob Holding tries a through ball, but Theo Walcott is caught offside.

Das muss doch besser gehen – besser und variantenreicher! Und zum Beweis habe ich einen rudimentären Livetickergenerator programmiert, der für einige typische Spielsituationen (erzieltes Tor, Fehlschuss, Parade), für umfassendere Spielbeschreibungen sowie für Trainerzitate zufallsbasiert Livetickermeldungen ausspuckt.

Weiterlesen

Der fachsprachliche Werkzeugkasten von spielverlagerung.de – Eine Inventur

Wer sich umfassend und detailreich über Fußballtaktik in ihrer ganzen Komplexität informieren möchte, der lese die Taktikanalysen von spielverlagerung.de. Und wem die „drischt die Kugel beherzt in den Winkel“-Diktion der Mainstream-Fußballpresse zu wenig differenziert ist, für den gilt dasselbe. Differenziertheit in den Beschreibungen und den Urteilen ist ganz sicher eine der obersten Maximen der SV-Autoren, was man nicht zuletzt an der neulich hier von mir zusammengestellten, unfassbar feingliedrigen Rollentaxonomie ersehen kann, die über die Jahre entwickelt wurde.

Das gefällt nicht jedem und muss es auch nicht. Zu kompliziert, zu nerdig, zu oberlehrerhaft sei das ganze. Was mir dagegen gefällt, ist die Reflektiertheit und, ha! Differenziertheit, mit der sich etwa der spielverlagerung-Gründer Tobias Escher – übrigens ausgebildeter Linguist – über die Funktionalität und den Adressatenzuschnitt des fachsprachlichen Registers geäußert hat, auch wenn er es so nicht genannt hat. Die Taktikanalysen richten sich eben nicht an alle, sondern an die, die ein Interesse an präzisen und fachlich korrekten Beschreibungen haben. Und neben den Grafiken sind nunmal sprachliche Beschreibungen das wichtigste Instrumentarium der Taktikanalysen, das dementsprechend gut präpariert sein will.

Weiterlesen

kreieren – Karriere einer Vokabel

Ausländische Fußballtrainer sind zuverlässige Motoren des Sprachwandels. Ein Trainer, der besonders deutliche Spuren hinterlassen hat, ist zweifelsohne Louis van Gaal, der während seines Engagements beim FC Bayern München (2009-2011) nicht nur einige Ausdrücke geprägt hat, die wohl für immer und ewig van-Gaal-Gedächtnis-Vokabeln sein werden, wie etwa das Feierbiest oder die Redewendung Tod oder Gladiolen. Bleibender noch, weil tatsächlich ins Paradigma des Deutschen vollständig integriert, ist die Verbphrase Chancen kreieren. In seinen vielbesprochenen Pressekonferenzen und Interviews hat van Gaal immer wieder davon gesprochen, dass man „zu wenig Torchancen kreiert“ habe und dass sich überhaupt das Trachten einer jeden siegeswilligen Mannschaft auf das „Kreieren von Chancen“ zu richten habe.

Diese Ausdrucksweise war neu und irgendwie schrullig, und Journalisten haben darum gerne eben diese Verbphrase mit Anführungszeichen markiert und als typische van-Gaal-Diktion ausgewiesen:

Den Pfosten hatte Toni in der ersten Halbzeit getroffen, eine von 14 Chancen, die seine Mannschaft dieses Mal „kreiert” habe, wie van Gaal zählte.
(SZ, 26.10.2009)

Dass es im modernen Fußball nicht genügt, auf die Geistesblitze Einzelner zu vertrauen, sondern dass „Räume vorbereitet werden müssen“ (Joachim Löw), damit „Chancen kreiert“ (Louis van Gaal) werden können.
(taz, 10.07.2010)

Das „Kreieren von Torchancen“, wie es Ex-Bayern-Trainer Louis van Gaal genannt hat, zählt zu den Problemen der Eintracht.
(Rhein-Zeitung, 20.04.2013)

Und tatsächlich findet man im Netz verschiedentlich die Vermutung, dass die inzwischen so üblich gewordene Rede vom Chancen kreieren ein Erbe van Gaals sei – auch wenn sich die Mitnennung des Schöpfers dieser Ausdrucksweise inzwischen erübrigt hat. Außerdem findet man die Vermutung, vor van Gaal hätte man Chancen vielmehr herausgespielt oder sich erarbeitet, aber inzwischen würde man eben nur noch kreieren. Zumindest diese Vermutung kann man nun anhand von Pressekorpora empirisch überprüfen.

Weiterlesen

« Ältere Beiträge

© 2018 Fußballlinguistik

Theme von Anders NorénHoch ↑