In diesem Kurs lernen Sie digitale und KI-basierte Verfahren zur Analyse von Texten kennen. Dazu wird nach einer theoretischen Einführung mit R Studio gearbeitet, um die Schritte zur Textklassifikation mit bekannten Kategorien zu erlernen. Neben einer kurzen technischen Einführung in R Studio werden die Sammlung, Organisation, Bereinigung und Vorbereitung von Textdaten vorgestellt und gemeinsam nachvollzogen.
Anschließend wird die Klassifikation von Textdaten anhand verschiedener Beispiele durchgeführt und so auf diktionärbasierte Ansätze, Supervised Machine Learning und Named Entity Recognition eingegangen. Die Verfahren werden anhand politischer Reden, Filmrezensionen und Romanen erarbeitet.
Neben Informationen und Videoformaten werden R Skripte bereitgestellt, die downgeloadet und zum eigenen Nachvollzug genutzt werden können. Für den Kurs sind deshalb keine Programmiervorkenntnisse notwendig. Ein generelles Verständnis für digitale Daten ist aber Voraussetzung.
GeisteswissenschaftlerInnen und SozialwissenschaftlerInnen sind die Hauptzielgruppe dieses Kurses.
Der Kurs wird in einem hybriden Format angeboten: Teilnehmende arbeiten sich durch die Lektionen des Moodle-Kurses, die mit verschiedenen Materialien angereichert sind, erproben Code und führen Verfahren selbständig aus. Erkenntnisse oder Probleme können optional in 2 synchron stattfindenden virtuellen Sprechstunden thematisiert werden.
Das Seminar kann im Rahmen des Zertifikats Digital Humanities im Modul DH 3 Praxis der Digital Humanities angerechnet werden. Das Seminar kann als Modul der ASQ (5 ECTS-Punkte) angerechnet werden.
Studierende, die sich den Kurs anrechnen lassen möchten, erstellen als Endleistung ein Forschungsexposee (mind. 2 Seiten), in dem sie beschreiben, wie sie mit den kennenglernten oder verwandten Verfahren eine eigens gewählte Forschungsfrage/ ein Forschungsanliegen im Bereich der digitalen Textanalyse bearbeiten würden. |