Schrieben Frauen und Männer im 19. Jahrhundert über die gleichen Themen? Welche Wörter nutzten sie, um diese auszudrücken? Um das zu untersuchen, haben wir die Methode des → Topic Modeling im → DARIAH Topics Explorer herangezogen. Wie das Topic Modeling durch maschinelle Lernverfahren gemeinsam genutzte Wörter in Texten zu Topics zusammenfasst, erklären wir im folgenden Video.
Schrieben Frauen und Männer im 19. Jahrhundert über die gleichen Themen? Welche Wörter nutzten sie, um diese auszudrücken? Leider sind nicht besonders viele Werke von Autorinnen aus dieser Zeit kanonisiert. Mit Hilfe des → TextGrid Repository ist es uns dennoch geglückt, rund 50 Werke von Schriftstellerinnen zu einem Korpus zusammen zu fassen. Diese rund 50 Werke haben wir mit ebenso vielen Erzähltexten männlicher Autoren verglichen.
Wir haben dazu die Methode des → Topic Modeling herangezogen und im → DARIAH Topics Explorer durchgeführt. Dabei werden Techniken des maschinellen Lernens (Latent Dirichlet Allocation) genutzt, um häufig gemeinsam genutzte Wörter zu Topics zusammen zu fassen. Diese Topics können dann im Interpretationsprozess auf Themen bezogen werden.
Topic Modeling ist eine zentrale Methode der digitalen Geisteswissenschaften und kann sehr gut zur digitalen Literaturanalyse herangezogen werden. Wenn Du → Topic Modeling selbst ausprobieren möchtest, schaue dir unsere → Video-Tutorials an oder durchlaufe unsere → Lerneinheit.