Eine hübsche Ressource für die Fußballlinguistik ist die Gerüchteküche von transfermarkt.de, wo mit allergrößter Ausdauer eine der weitreichendsten Folgen der Professionalisierung und Kommerzialisierung des Fußballs besprochen wird: Der nicht selten mit schier unvorstellbaren Geldsummen verbundene Vereinswechsel von vertraglich gebundenen Spielern. Die ohnehin die offizielle Fußballberichterstattung, aber auch das informelle Sprechen über den Vereinsfußball beherrschenden Mutmaßungen, wer wann für wieviel wohin und warum wechseln wird, werden im Diskussionforum von transfermarkt.de in eine recht streng reglementierte und durch allerlei Daten wie Leistungsdaten, geschätzter Marktwert usw. angereicherte Form gegossen.

Foto: cranky messiah (flickr, CC BY-NC 2.0)

Die Regeln sehen vor, dass nur eine allgemein zugängliche redaktionelle „Quelle“ (etwa eine Meldung von kicker.de) einen Gerüchtethread eröffnen darf, die dann in teilweise sehr ausführlichen Diskussionen weiter kommentiert wird, also auf ihre Glaubwürdigkeit und die Wahrscheinlichkeit ihres Zutreffens hin eingeschätzt wird. Das geschieht zum einen dadurch, dass die Verlässlichkeit der Quellen beurteilt werden, zum anderen dadurch, dass über Sinn und Unsinn des entsprechenden Transfers diskutiert wird (etwa vor dem Hintergrund der besonderen Stärken und Schwächen eines Spielers), die diesen wahrscheinlich oder unwahrscheinlich machen.

Die Diskussionen sind eine schöne Quelle für allerlei linguistische Fragestellungen, die unter Bezeichnungen wie „Glaubwürdigkeit“, „Evidentialität“ oder „Epistemizität“ im Fach recht etabliert sind und z.B. am Beispiel von Schlichtungsgesprächen bearbeitet wurden. Transfergerüchte sind aber bisher unerforscht geblieben. In der Kommunikationswissenschaft hat Catharina Vögele (Hohenheim) kürzlich eine Monographie und eine Kurzfassung in Artikelform zum Thema publiziert und u.a. in quantitativen Inhaltsanalysen einige Gemeinsamkeiten und Unterschiede zwischen Journalist_innen und Fans bei der Bearbeitung von Gerüchten aufgezeigt hat. Die Auswertung folgt allen Regeln der inhaltsanalytischen Kunst einschließich Inter-Coder-Reliabilitätstest usw. Die konkrete sprachliche Umsetzung der thematisierten Argumentationsmuster wird aber nicht näher beleuchtet.

Ideen für eine korpusbasierte Linguistik des Gerüchts

Und hier kann die Korpuslinguistik natürlich einspringen. Ich habe also ein Script geschrieben, das zu den insgesamt rund 25.000 Gerüchten die Postings im xml-Format extrahiert. Ob ich wirklich das ganze Material herunterlade, wird man sehen, denn es dürfte sehr viel Text werden. Beginnen wir also mit einer Stichprobe: 1000 Gerüchte, ca. 34.000 Postings (und wenn man die mit dazurechnet, wo nur eine Quelle ohne weiteren Kommentar zitiert wird, sind es 37.000), 2,5 Mio. Tokens. Noch ein paar Zahlen: Der Median bei der Anzahl der Postings pro Gerücht liegt bei 13, der Spitzenwert mit 1484 Postings fällt auf das Gerücht Niklas Füllkrug zu Mönchengladbach, nur bei 157 Gerüchten wird überhaupt nicht auf die threaderöffnende Quelle reagiert. Insgesamt also ein recht lebendiges Forum.

[Update vom 11.9.2018: Inzwischen habe ich die komplette Gerüchteküche heruntergeladen: 24.179 Gerüchte, 745.696 Posts plus 113.044 Posts mit Quellenzitaten ohne weiteren Kommentar, 58.7 Mio. Tokens. Der Median der Posts pro Gerücht liegt bei 14, nur bei 1547 Gerüchten  (das sind 6%) wird nicht auf die threaderöffnende Quelle reagiert. Das meistdiskutierte Gerücht ist das zum Wechsel von Robert Lewandowski zu Bayern München mit 7920 Beiträgen.]

Schon in dieser Stichprobe zeigen sich mit ganz kursorischen korpuslinguistischen Untersuchungen wie etwa Ngram-Analysen einige interessante Details. 657 mal findet sich das Trigramm kann ich mir, das in fast allen Fällen zu einer Wendung wie kann ich mir (beim besten Willen/absolut) nicht vorstellen ergänzt wird. Die ganz subjektive Einschätzung und das subjektive Vorstellungsvermögen hinsichtlich der erwartbaren Folgen eines Transfers stehen hier im Vordergrund. Solche produktive Einbildungskraft (um mit Kant zu sprechen) dürfte in journalistischen Zusammenhängen weniger relevant sein. Aber auch sonst sind die Postings vielfach von dem Bemühen gekennzeichnet, die Einschätzungen als subjektiv zu kennzeichnen, hochfrequente Trigramme sind etwa meiner Meinung nachin meinen Augen und aus meiner Sicht. Andere Ngramme wie wenn man sich (anschaut/vor Augen hält) und auch wenn er deuten darauf hin, dass in den Postings tatsächlich argumentiert und verschiedene Optionen gegeneinander abgewogen werden, während journalistische Beiträgen wohl eher berichtend gehalten sind.

Weitere Analysen könnten etwa der Frage nachgehen, wie aus argumentativem Sprachgebrauch bekannte Muster wie etwa der kausale Konnektor deshalb in den Postings verwendet werden, welche Rolle evidentielle Modalitätsmarker wie wohl oder vermutlich spielen oder wie Redewiedergabesignale wie laut XY eingesetzt werden. Für eine korpusgestützte, vielleicht sogar datengeleitete Linguistik des Gerüchts, die dann Schlaglichter auf das große Thema Sprache und Wissen werfen kann, sind die Daten jedenfalls bestens geeignet. To be continued…