Lerneinheiten

Viele der Methoden zur digitalen Textarbeit bedürfen neben einer grundlegenden Methodenkenntnis tiefergehende Fertigkeiten, wenn es um die praktische Umsetzung geht. Im Abschnitt Lerneinheiten erarbeiten wir für Sie daher Tutorials, um die einzelnen Methoden (im Zusammenhang mit entsprechenden Ressourcen und Tools) beispielhaft zu erlernen.

Analyse und Visualisierung mit CATMA

29. November 2019
Lerneinheit Analyse und Visualisierung mit CATMA

● Anwendungsbezug: Franz Kafkas Erstes Leid (1924)
● Methoden: Analyse, Visualisierung, halb-automatische Annotation
● Angewendetes Tool: CATMA
● Lernziele: quantitative Analyse von Text- und Annotationsdaten; Erstellen von Queries und interaktiven Visualisierungen; Anpassen der Visualisierungen; automatische Annotation ausgewählter Keywords
● Dauer der Lerneinheit: ca. 90 Minuten
● Schwierigkeitsgrad des Tools: leicht

CATMA-Annotationen auswerten, Gold Standard erstellen und Inter-Annotator-Agreement berechnen mit GitMA

● Anwendungsbezug: Franz Kafkas Urteil
● Methodik: Digitale manuelle Annotation
● Angewendetes Tool: CATMA und GitHub sowie das Python-Package GitMA
● Lernziele: Laden eines Demo-Projektes aus CATMA, Überblick über Annotationen verschaffen, Annotationsdaten in Tabellen visualisieren, Goldstandard erstellen, IAA berechnen
● Dauer der Lerneinheit: ca. 3 Stunden
● Schwierigkeitsgrad des Tools: mittel

Korpusanalyse mit CATMA

16. November 2020
Small Multiples Wordclouds einer Korpusanalyse mit CATMA

● Anwendungsbezug: Genderverteilung in Romanen des 18. Jahrhunderts
● Methoden: Analyse, Visualisierung)
● Angewendetes Tool: CATMA
● Lernziele: quantitative Analyse von Text- und Annotationsdaten; Erstellen von Queries und Visualisierungen
● Dauer der Lerneinheit: ca. 90 Minuten
● Schwierigkeitsgrad des Tools: leicht

Manuelle Annotation mit CATMA

4. November 2019
Lerneinheit Manuelle Annotation mit CATMA

● Anwendungsbezug: Franz Kafkas Erstes Leid (1924)
● Methodik: Digitale taxonomiebasierte manuelle Annotation
● Angewendetes Tool: CATMA
● Lernziele: Erstellung eines CATMA-Accounts und eines CATMA-Projektes, Organisation von Ressourcen und Annotation eines Textes mit unterschiedlichen Kategorien
● Dauer der Lerneinheit: ca. 60–90 Minuten
● Schwierigkeitsgrad des Tools: leicht

Named Entity Recognition mit dem Stanford Named Entity Recognizer

26. August 2019
Named Entity Recognition mit dem Stanford-NER-Tool

● Anwendungsbezug: Figuren in Goethes Wahlverwandtschaften (1809)
● Methodik: Named Entity Recognition (NER)
● Angewendetes Tool: Stanford Named Entity Recognizer
● Lernziele: Automatische Annotation von Figuren, Berechnung der Güte des Ergebnisses, Verbesserung der Erkennung durch Training eines eigenen NER-Modells
● Dauer der Lerneinheit: 120 Minuten
● Schwierigkeitsgrad des Tools: mittel bis schwierig

Netzwerkanalyse mit Gephi

4. Dezember 2020
Lerneinheit: Netzwerkanalyse mit Gephi

● Anwendungsbezug: Figurenkonstellation in Emilia Galotti
● Methodik: Netzwerkanalyse
● Angewendetes Tool: Gephi
● Lernziele: Erstellen und Auswerten eines Figuren-Netzwerks: Anpassen des Netzwerks auf Datenebene und Individualisierung der Visualisierung, Download der Netzwerk-Grafiken
● Dauer der Lerneinheit: ca. 90 Minuten
● Schwierigkeitsgrad des Tools: mittel

Preprocessing mit NLTK

Eckdaten der Lerneinheit

  • Anwendungsbezug: Textvorverarbeitung von Goethes “Die Leiden des jungen Werthers”
  • Methodik: Korpusbildung und Preprocessing
  • Angewendetes Tool: NLTK
  • Lernziele: Einzelne Schritte zur Textbereinigung, wie z.B. Löschen von Leerzeilen, Entfernen von Stoppwörtern oder Tokenisierung auswählen und durchführen können
  • Dauer der Lerneinheit: ca. 60 Minuten
  • Schwierigkeitsgrad des Tools: mittel

 

Sentimentanalyse mit SentText

29. Juni 2020
Sentimentanalyse mit SentText - eine autodidaktische Lerneinheit

• Anwendungsbezug: Lexikonbasierte Sentimentanalyse bedeutender griechischer Dramen (Der gefesselte Prometheus von Aischylos, Die Wolken von Aristophanes, Medea von Euripides), Epen (Odyssee und Ilias von Homer, Theogonia von Hesiodos) und Lyrik (Der goldene Esel von Apuleius, Metamorphosen von Ovid, Auf die Liebe von Anakreon)
• Methodik: Lexikonbasierte Sentimentanalyse
• Angewendetes Tool: SentText
• Lernziele: Zentrale Schritte der Korpuskonstituierung umsetzen, Hochladen der Texte und Kennenlernen der Analyseparameter, Analyse einzelner Texte und Interpretation der Analyseergebnisse, vergleichende Analyse der Homerischen Epen und Interpretation der Analyseergebnisse, manuelle Korrektur der Sentimentwerte, gattungstypologische Korpuskonstituierung, vergleichende Sentimentanalyse der drei Teilkorpora
• Dauer der Lerneinheit: 90 Minuten
• Schwierigkeitsgrad des Tools: einfach

Stilometrie mit Stylo

20. Mai 2019
Stilometrie mit Stylo GUI Bootstrap Consensus Tree Cluster Analysis Computational Stylistics Group R Rstudio

● Anwendungsbezug: 67 deutschsprachige Texte
● Methodik: Stilometrische Analyse
● Angewendetes Tool: Stylo
● Lernziele: Installation von R, RStudio und des Stylo-Packages, Anwendung unterschiedlicher stilometrischer Analysemethoden, Interpretation der Visualisierungen
● Dauer der Lerneinheit: ca. 90 Minuten
● Schwierigkeitsgrad des Tools: mittel

Textvisualisierung mit Voyant

17. Juni 2019
Voyant-Tools: Facettenreiche Möglichkeiten der digitalen Textanalyse

● Anwendungsbezug: Gotthold Ephraim Lessings bürgerliches Trauerspiel Emilia Galotti
● Methodik: Distant Reading und Textvisualisierung
● Angewendetes Tool: Voyant
● Lernziele: Textauswahl und Nutzung elementarer Voyant-Funktionalitäten: Erstellen einer Stoppwortliste, Arbeit mit dem Voyant-Toolkit, Export der erstellten Visualisierungen und deren Interpretation
● Dauer der Lerneinheit: ca. 60 Minuten
● Schwierigkeitsgrad des Tools: einfach

Topic Modeling mit dem DARIAH Topics Explorer

21. Januar 2019
DARIAH Topics Explorer – Topic Modeling ohne Vorkenntnisse

● Anwendungsbezug: Hans Christian Andersens Märchen
● Methodik: Topic Modeling in Prosatexten eines Autors
● Angewendetes Tool: DARIAH Topics Explorer
● Lernziele: Zusammenstellung und thematische Exploration einer kleinen bis mittelgroßen Textsammlung, Installation des Tools, Auswertung/Interpretation der Ergebnisse
● Dauer der Lerneinheit: ca. 90 Minuten
● Schwierigkeitsgrad des Tools: leicht bis mittel

word2vec mit Gensim

20. April 2023

● Anwendungsbezug: Frauen- und Männerrollen in Goethes Erzähltexten und Dramen
● Methode: word2vec
● Angewendetes Tool: Gensim
● Lernziele: Trainieren eines word2vec-Modells, einfache Abfragen und Vektorarithmetik, erstellen von Visualisierungen zum gesamten Korpus und zu einzelnen semantischen Feldern
● Dauer der Lerneinheit: 60-90 Minuten
● Schwierigkeitsgrad des Tools: mittel