Die multilingualen Korpora zur Fußballlinguistik enthalten internetbasierte Texte und transkribierte mündliche Texte aus dem thematischen Bereich der Fußballberichterstattung in vollständig annotierter Form. Sie werden hier über das webbasierte Tool CQPweb der Fachöffentlichkeit frei zugänglich gemacht. Die Korpora enthalten zur Zeit (September 2021) Texte der Textsorten Liveticker, Spielbericht, Taktikanalyse, Elf des Spieltags, Einzelkritik und Livereportage verschiedener Anbieter in den Sprachen deutsch, englisch, niederländisch, französisch, italienisch, spanisch, portugiesisch, norwegisch, polnisch, tschechisch, russisch, ungarisch und griechisch im Umfang von rund 75 Millionen Wörtern.

Die Korpora sind für linguistische, insbesondere korpuslinguistische Zwecke gedacht und sind kein Artikelarchiv im herkömmlichen Sinn. Es ist aus Gründen des Urheberrechts nicht möglich, sich ganze Artikel anzeigen zu lassen oder herunterzuladen. Allerdings sind alle Belege mit der Originalquelle verlinkt. Außerdem stehen die üblichen korpuslinguistischen Suchmethoden zur Verfügung: Volltextsuche, Suche nach Part-of-Speech-Informationen, Keywordanalysen, Kollokationen etc.

Bitte beachten Sie die ausführliche Korpusdokumentation mit Informationen zur Zusammenstellung der Korpora, zu den Quellen und zur Textrepräsentation sowie zur korpuslinguistischen Aufbereitung. Ein kurzes Tutorial führt in das Tool und seine Abfragemöglichkeiten ein.

Die Korpora dürfen nur für wissenschaftliche Zwecke und nicht kommerziell verwendet werden. Die Herkunft der Daten (www.fussballlinguistik.de/korpora) muss immer angegeben werden. Die Korpora als ganze können wie folgt zitiert werden:

Meier-Vieracker, Simon (Hg.) (2021): Korpora zur Fußballlinguistik (Release 2021-09), Professur für Angewandte Linguistik, TU Dresden, www.fussballlinguistik.de/korpora.

Fussballlinguistik.de dankt den Textgebern, die ihre Texte für wissenschaftliche Zwecke zur Verfügung stellen:

Olympia-Verlag GmbH (kicker.de)
HEIM:SPIEL Medien GmbH & Co. KG (weltfussball.de)
SID Sport-Informations-Dienst GmbH
Maric, Rieke, Escher & Rafelt Spielverlagerung GbR (spielverlagerung.de)
Karsten Jahn (halbfeldflanke.de)
Gunnar Lott (niemalsallein.de)
Sports Mole Ltd. (sportsmole.co.uk)
Westdeutscher Rundfunk (sportschau.de)
SportUpdate B.V. (fcupdate.nl)
liveresult.ru 

Für den technischen Support danke ich Nick Hainke und Gregor Mitzka.

Literatur

Meier, Simon (2017): Korpora zur Fußballlinguistik – eine mehrsprachige Forschungsressource zur Sprache der Fußballberichterstattung. In: Zeitschrift für germanistische Linguistik 45(2), S. 345–349.