Auf fussballlinguistik.de werden Ergebnisse kleiner empirischer Studien veröffentlicht. Hauptquellen sind im Netz verfügbare Daten einschlägiger Anbieter, insbesondere kicker.de, sportal.de, weltfussball.de und sportschau.de, sowie des Taktikblogs spielverlagerung.de. Außerdem greife ich regelmäßig auf die Korpora des IDS Mannheim, insbesondere die dort verfügbaren Pressekorpora, und das Digitale Wörterbuch der Deutschen Sprache zurück.

Die Primärdaten wurden in weiten Teilen mit dem kostenlosen Tool import.io oder mit dem Kommandozeilenprogramm wget extrahiert, in einem einfachen Texteditor in xml überführt, mit dem TreeTagger annotiert und für die IMS Open Corpus Workbench aufbereitet. Das CQP-basierte Tool ermöglicht Abfragen annotierter Daten, so dass z.B. nach bestimmten Wortarten gesucht werden kann. Zudem verwende ich regelmäßig die Konkordanzsoftware AntConc sowie das Ngram Statistics Package für statistische Berechnungen von typischen Wortverbindungen. Für den Export von Twitter-Daten verwende ich das Twitter Archive.

Alle Quellen und Tools sind, sofern sie nicht für kommerzielle Zwecke genutzt werden, kostenlos verfügbar. Hinweise zur Benutzung finden sich unter den hier angegebenen Links; als Einführung empfehle ich das Tutorial von Noah Bubenhofer.

Ein Teil der Daten steht in den öffentlichen Korpora zur Fußballlinguistik der Fachöffentlichkeit für eigene Forschungsfragen zur Verfügung.

Die auf fussballlinguistik.de veröffentlichten Analysen beanspruchen keine Gültigkeit über die genannten Quellen hinaus. Insbesondere Aussagen über bestimmte Verwendungsweisen von Ausdrücken einschließlich ihres Entstehens  bleiben natürlich an die verwendeten Quellen gebunden, die in den einzelnen Beiträgen noch einmal präziser benannt werden. Ich bin kein Fußballexperte und freue mich über präzisierende und korrigierende Kommentare, solange sie nachprüfbar, also mit Angabe von Quellen belegt sind.