YouTube Data Tools
- ermöglicht den Download von YouTube-Kommentaren (unter „Video Info and Comments“)
- keine Accounts erforderlich
- Daten im tab-Format entweder zuerst im Texteditor (BBEdit, , Komodo Edit oder Notepad++) öffnen, dann per copy&paste in Excel einfügen oder in Google Spreadsheets öffnen.
- Für korpuslinguistische Analysen dann nur die Spalte mit dem Text rauskopieren und als txt abspeichern (auf Unix-Systemen auch möglich:
cut -f 6 input.tab > output.txt
). - Dann entweder in AntConc unter „Global Settings“ Tags < > aus der Suche ausschließen, oder sie im Editor mit dem Regex
<.+?>
entfernen.
Netvizz (Facebook)
- Tool „page data“ ermöglicht den Download von Facebook-Posts und/oder Kommentaren von öffentlichen Seiten
- Facebook-Account erforderlich
- Mac-Nutzer: Nicht Safari, sondern Firefox o.ä. verwenden!
- Daten im tab-Format wie bei den YouTube Data Tools öffnen nun weiter verarbeiten
Twitter-Scraper (1): TAGS
- Google-Plugin, das die Extraktion von Tweets mit gewissen Einschränkungen ermöglicht (max. 3000/h, max sieben Tage zurück)
- Aktive Suchanfrage erhebt laufend neue Tweets
- Einfache Visualisierungen von Netzwerkstrukturen möglich
- benötigt einen aktiven Twitter Account und einen aktiven Google-Account
Twitter-Scraper (2): Rtweet
- Bibliothek der Statistik-Software R
- Benötigt einen Twitter-Account
- Nicht ganz intuitiv in der Bedienung, dafür sehr schnell und flexibel
AntConc
- Einfach zu bedienende Korpusanalyse-Software
- Mac-Nutzer*innen: Mit Rechtsklick öffnen und dem Softwareentwickler vertrauen
- Benötigt txt- oder xml-Files (nicht .docx o.ä.!)
- Für die YouTube-Daten in den Global Settings die Option „Hide tags“ wählen.
- Nützliche Tools: Wortlisten, Ngrams, Kollokationen, Keywords
- Für Keywordberechnungen bietet sich als Referenzkorpus eine der News-Sammlungen vom Leipziger Wortschatzportal an
- Für Kollokationen entweder in den Tool Settings das statistische Maß LogLikelihood wählen oder Min. Collocate Frequency auf 5 setzen.
SketchEngine
- Webbasierte, sehr mächtige und schnelle Korpusanalyse-Software
- Anmeldung über TU-Account
- Nutzung der verfügbaren oder Erstellung eigener Korpora (txt)
- Automatisiertes part-of-speech-Tagging