YouTube Data Tools

  • ermöglicht den Download von YouTube-Kommentaren (unter „Video Info and Comments“)
  • keine Accounts erforderlich
  • Daten im tab-Format entweder zuerst im Texteditor (BBEdit, , Komodo Edit oder Notepad++) öffnen, dann per copy&paste in Excel einfügen oder in Google Spreadsheets öffnen.
  • Für korpuslinguistische Analysen dann nur die Spalte mit dem Text rauskopieren und als txt abspeichern (auf Unix-Systemen auch möglich: cut -f 6 input.tab > output.txt).
  • Dann entweder in AntConc unter „Global Settings“ Tags < > aus der Suche ausschließen, oder sie im Editor mit dem Regex <.+?> entfernen.

Netvizz (Facebook)

  • Tool „page data“ ermöglicht den Download von Facebook-Posts und/oder Kommentaren von öffentlichen Seiten
  • Facebook-Account erforderlich
  • Mac-Nutzer: Nicht Safari, sondern Firefox o.ä. verwenden!
  • Daten im tab-Format wie bei den YouTube Data Tools öffnen nun weiter verarbeiten

Twitter-Scraper (1): TAGS

  • Google-Plugin, das die Extraktion von Tweets mit gewissen Einschränkungen ermöglicht (max. 3000/h, max sieben Tage zurück)
  • Aktive Suchanfrage erhebt laufend neue Tweets
  • Einfache Visualisierungen von Netzwerkstrukturen möglich
  • benötigt einen aktiven Twitter Account und einen aktiven Google-Account

Twitter-Scraper (2): Rtweet

  • Bibliothek der Statistik-Software R
  • Benötigt einen Twitter-Account
  • Nicht ganz intuitiv in der Bedienung, dafür sehr schnell und flexibel

AntConc

  • Einfach zu bedienende Korpusanalyse-Software
  • Mac-Nutzer*innen: Mit Rechtsklick öffnen und dem Softwareentwickler vertrauen
  • Benötigt txt- oder xml-Files (nicht .docx o.ä.!)
  • Für die YouTube-Daten in den Global Settings die Option „Hide tags“ wählen.
  • Nützliche Tools: Wortlisten, Ngrams, Kollokationen, Keywords
  • Für Keywordberechnungen bietet sich als Referenzkorpus eine der News-Sammlungen vom Leipziger Wortschatzportal an
  • Für Kollokationen entweder in den Tool Settings das statistische Maß LogLikelihood wählen oder Min. Collocate Frequency auf 5 setzen.

SketchEngine

  • Webbasierte, sehr mächtige und schnelle Korpusanalyse-Software
  • Anmeldung über TU-Account
  • Nutzung der verfügbaren oder Erstellung eigener Korpora (txt)
  • Automatisiertes part-of-speech-Tagging