Topic Modeling mit dem DARIAH Topics Explorer lehren

Eckdaten des Lehrmoduls

  • Thema der Sitzung: Themen und Topics bei Friedrich Schiller und Wilhelm Hauff
  • Lernziele: Kenntnisse über die Methode des Topic Modeling, sicherer Umgang mit dem DARIAH Topics Explorer, kritische Bewertung der Methode, Autoren- und Epochenkenntnisse (Sturm und Drang, Weimarer Klassik, Romantik)
  • Phasen: Einführende Begriffsdiskussion (Themen vs. Topics), Vorstellung und Diskussion der Methode, Demonstration der Toolfunktionen, Gruppenarbeit, Gruppenpräsentationen
  • Sozialformen: Diskussion, Vortrag, Gruppenarbeit
  • Medien/Materialien: Alle Lernenden müssen einen Laptop haben, auf dem der DARIAH Topics Explorer installiert ist; Lehrende benötigen einen Laptop und Beamer
  • Dauer des Lehrmoduls: 2 x 90 Minuten
  • Schwierigkeitsgrad des Tools: leicht bis mittel

Bausteine

  • Verlaufsraster des Lehrmoduls
    Aus welchen Phasen setzt sich das Lehrmodul zusammen? Dem Verlaufsplan entnehmen Sie Inhalte und Schwerpunkte.
  • Anwendungsbeispiel
    Anhand welcher Texte unterrichten Sie Topic Modeling? Leiten Sie die Studierenden dazu an, Themen in den Dramen Friedrich Schillers und den Prosawerken Wilhelm Hauffs zu explorieren.
  • Verlauf der Unterrichtseinheit(en)
    Wie sieht die konkrete Ausgestaltung der Phasen aus und welche Arbeitsschritte werden vorgenommen? Erfahren Sie, wie die Unterrichtseinheit strukturiert ist und welche Beispielaufgaben Sie Ihren Studierenden stellen können.
  • Lösungen zu den Beispielaufgaben
    Hat die Lerngruppe die Beispielaufgaben richtig gelöst? Hier erfahren Sie, wie Sie die Antworten erhalten.

Verlaufraster des Lehrmoduls

Phase Impulse des/der Lehrenden Erwartete Aktivität der Lernenden Sozialform Medien / Materialien
Vorab und Einstieg
(ca. 15 Minuten)
Was unterscheidet die Begriffe Thema, Stoff, Motiv, Topos und Topic? Vorab: Methodeneintrag → Topic Modeling und Lerneinheit → Topic Modeling mit dem DARIAH Topics Explorer; Beteiligung an der Diskussion Diskussion im Plenum Beamer, Laptop
Problematisierung
(ca. 15 Minuten)
Warum ist ein Topic kein Thema? Wie funktioniert Topic Modeling? Beteiligung an der Diskussion; Rückbezug auf Methodeneintrag Diskussion im Plenum Beamer, Laptop
Erarbeitung
(ca. 60 Minuten)
Vorstellung der Toolfunktionen; Betreuung der Kleingruppen Hands-on Topic Modeling in Kleingruppen; Vorbereitung einer Präsentation als Hausaufgabe Lehrvortrag und Gruppenarbeit Beamer, Laptop, DARIAH Topics Explorer, zwei Korpora, zwei Stoppwortlisten
Sicherung
(ca. 50 Minuten)
Betreuung der Gruppen gegenseitige Präsentation der Gruppenarbeitsergebnisse Gruppenarbeit Laptops, DARIAH Topics Explorer, zwei Korpora, zwei Stoppwortlisten
Reflexion & Transfer
(ca. 40 Minuten)
Diskussion von Schwierigkeiten, Impulse für Transfer geben Ergebnisse und Schwierigkeiten aus den Gruppenpräsentationen diskutieren Diskussion im Plenum Beamer, Laptops
Download des Verlaufsrasters als PDF-Datei
Download des vollständigen Verlaufsrasters als PDF-Datei

1. Anwendungsbeispiel

In zwei Seminarsitzungen werden Sie die Methode → Topic Modeling lehren, die ein probabilistisches Verfahren zur thematischen Exploration größerer Textsammlungen ist. Die Studierenden probieren die Methode an einem Dramenkorpus von Friedrich Schiller und einer Sammlung von Erzählungen Wilhelm Hauffs mithilfe des → DARIAH Topics Explorers praktisch in Kleingruppen aus und präsentieren ihre Ergebnisse.

2. Verlauf der Unterrichtseinheiten

2.1 Vorarbeiten

Die Studierenden sollten vorab den Methodeneintrag → Topic Modeling und den Tooleintrag → DARIAH Topics Explorer gelesen, sowie die Lerneinheit → Topic Modeling mit dem DARIAH Topics Explorer durchgearbeitet haben. Hilfreich wäre es zudem, sie die Tutorialvideos → Topic Modeling und Literaturanalyse sowie die Fallstudie → Literatur des 19. Jahrhunderts analysiert schauen zu lassen. Im Zuge der Lerneinheit wird das Tool bereits installiert, sodass etwaige technische Schwierigkeiten bereits vor der Sitzung adressiert und behoben werden können. Außerdem sollten Sie Ihren Studierenden vorab das vom → TextGrid Repository stammende Schillerkorpus [hier] und das Hauffkorpus [hier] sowie die von uns vorbereitete Stoppwortliste für das Schillerkorpus [hier] und die Stoppwortliste für das Hauffkorpus [hier] auf der eLearning-Plattform Ihrer Institution zur Verfügung stellen. Möchten Sie mit anderen digitalen Textsammlungen arbeiten, können Sie sich diese bspw. im → TextGrid Repository oder im → Deutschen Textarchiv (DTA) selbst zusammenstellen. Das Korpus muss mindestens zehn Texte enthalten, damit der Topics Explorer arbeiten kann, und die Texte sollten alle das gleiche Format haben. Der Topics Explorer kann TXT- und TEI-XML-Dateien verarbeiten. Die Beispielaufgaben in diesem Lehrmodul beziehen sich auf das Schiller- und das Hauffkorpus. Sollten Sie Ihre Seminarsitzungen nicht in einem Computerlabor abhalten, erinnern Sie Ihre Studierenden daran, einen eigenen Laptop mitzubringen. Eine 1:1-Ausstattung ist sinnvoll, da sich der Umgang mit dem Topics Explorer durch eigenhändiges Ausprobieren am besten vermitteln lässt. Es sollten auf keinen Fall mehr als zwei Studierende an einem Gerät arbeiten.

Je nachdem, welchen Lehrstil Sie persönlich präferieren, kann es sinnvoll sein, für den Einstieg in die Stunde Folien vorzubereiten, die die Diskussion über Topics und Themen mit Anschauungsbeispielen und wichtigen Schlagwörtern befördern. Wir haben Ihnen hier beispielhaft ein paar Folien für den Einstieg entworfen, die Sie nutzen oder weiter ausarbeiten können.

2.2 Einstieg und Problematisierung

Um den beiden Unterrichtseinheiten (die vermutlich mit einer Woche Unterbrechung abgehalten werden) einen inneren Zusammenhang zu verleihen, sollten Sie zu Beginn transparent machen, welche Lernziele in den beiden Sitzungen erreicht werden sollen und was die Lerngruppe in den einzelnen Sitzungen erwartet.

  • Es sollen Kenntnisse über die Methode des Topic Modeling und ein sicherer Umgang mit dem DARIAH Topics Explorer vermittelt werden.
  • Die Studierenden sollen einerseits die Methode kritisch bewerten, andererseits aber auch Autoren- und Epochenkenntnisse (über Sturm und Drang, Weimarer Klassik und Romantik) erwerben. Sie können hierbei selbst Schwerpunkte setzen.

In einem literaturwissenschaftlichen Seminar bietet es sich an, nach Nennung der Lernziele mit einem Rückbezug auf die fachliche Tradition zu beginnen. Auf diese Weise werden literaturwissenschaftliche Fachkompetenzen vermittelt und Vorwissen aktiviert. Beim Topic Modeling kann dies über die Diskussion von Fachbegriffen geschehen. Sie starten mit einer aktivierenden Diskussion: Fragen Sie die Studierenden nach den Themen der bereits im Seminar behandelten Primärtexte oder nach den Themen von Texten, die Sie vorab ausgewählt haben. Sinnvoll ist es hierbei, Texte aus unterschiedlichen Epochen und Gattungen auszuwählen, die jedoch das gleiche Thema behandeln (so ist z. B. das Thema „Streben nach Macht” in so unterschiedlichen Werken wie Schillers Maria Stuart als auch in Martins A Song of Ice and Fire zentral). Fragen Sie dann nach den Begriffen Stoff, Motiv und Topos in Verbindung mit den von Ihnen ausgewählten Texten und kontrastieren in der Diskussion die Begriffe. Dabei sollte deutlich werden, dass die Begriffe zwar unterschiedliche Aspekte von textlichen Inhalten beschreiben, die Begriffsverwendung auch in der Fachwissenschaft jedoch nicht einheitlich ist.

Auf Grundlage dieser Begrifflichkeiten diskutieren Sie die Dimensionen des Topic-Begriffs und mit Rückbezug auf den Methodeneintrag → Topic Modeling die grundsätzlichen Annahmen, die diesem Verfahren zugrunde liegen. In dieser Phase der Unterrichtseinheit können Sie zudem Beispiele von Topics zeigen, die auf bestimmten Texten oder Textsammlungen basieren (die im Methodeneintrag angegebenen Sekundärtexte und auch unsere Einstiegsfolien liefern Ihnen hierfür bei Bedarf Material). Geben Sie den Studierenden im Rahmen der ersten Unterrichtsphase die Gelegenheit, Fragen zu stellen und Schwierigkeiten, die sie mit dem Methodeneintrag hatten, zu diskutieren. Nach etwa einer halben Stunde sollten Sie langsam in die Erarbeitungsphase überleiten, indem Sie z. B. explizit nach den Erfahrungen fragen, welche die Studierenden mit der Lerneinheit → Topic Modeling mit dem DARIAH Topics Explorer hatten.

2.3 Erarbeitung

Mit Rückbezug auf die angesprochenen Schwierigkeiten aus der Lerneinheit führen Sie die Studierenden mit Unterstützung des Beamers einmal an Ihrem eigenen Gerät durch die einzelnen Module des DARIAH Topics Explorers. Geben Sie den Studierenden auch hierbei die Möglichkeit, Verständnisschwierigkeiten anzusprechen, um diese im Plenum beheben zu können. Dieser Vortrag sollte maximal 15 Minuten in Anspruch nehmen, damit für die anschließende Arbeit in Kleingruppen noch genügend Zeit bleibt.

Teilen Sie nun die Studierenden in Kleingruppen von 2–3 Personen ein. Größere Gruppen sind bei der gemeinsamen Arbeit mit digitalen Tools nur sinnvoll, wenn diese Tools selbst eine Funktion für kollaboratives Arbeiten haben. Da dies beim DARIAH Topics Explorer nicht der Fall ist, sollten möglichst alle Gruppenmitglieder an ihrem eigenen Laptop arbeiten, wobei gruppenintern trotzdem im Peer-to-Peer-Modus zusammengearbeitet wird. Die eine Hälfte dieser Kleingruppen wird sich im Folgenden mit dem Schillerkorpus, die andere mit dem Hauffkorpus auseinandersetzen. Achten Sie auf eine ausgewogene Aufteilung.

Geben Sie den Gruppen folgende Arbeitsaufträge an die Hand:

Aufgabe 1
Welches Dokument ist das umfangreichste in Ihrem Korpus?

Aufgabe 2
Bei welchen Einstellungen (Topicmenge und Iterationen) erhalten Sie Topics, die konsistente Themen abbilden? Stimmt die algorithmische Angabe (Log-likelihood) mit Ihrem persönlichen Eindruck überein?

Aufgabe 3
Schauen Sie sich die bereitgestellte Stoppwortliste an. Welche interpretatorischen Vorannahmen werden durch den Ausschluss der dort aufgeführten Wörter getroffen? Warum werden dort bspw. Figurennamen aufgeführt? Betrachten Sie auch die vom DARIAH Topics Explorer bereitgestellte Stoppwortliste für deutsche Texte. Welche der dort aufgeführten Wörter sollten in Bezug auf Schiller und/oder Hauff nicht „gestoppt” werden?

Aufgabe 4
Finden Sie Topics, die besonders dokumentspezifisch sind oder Dokumente, die ein bestimmtes Topic besonders stark abbilden? Was könnten Gründe dafür sein und was sind Vor- oder Nachteile einer solchen Verteilung?

Aufgabe 5
Woran können Sie anhand Ihrer Topics erkennen, welcher Gattung Ihr Korpus zugehört?

Aufgabe 6
Modellieren Sie ein Topic zum Thema Liebe und eins zum Thema Natur. Finden Sie hier autoren- oder gar epochentypische Konstellationen wieder?

Stehen Sie den Kleingruppen während der Erarbeitungsphase für Nachfragen zur Verfügung bzw. verschaffen Sie sich einen eigenen Überblick über den Stand der Gruppenarbeiten. Der erste Teil des Lehrmoduls endet nun. Zu diesem Zeitpunkt haben die Studierenden sich zunächst im Rahmen einer Diskussion mit den literaturwissenschaftlichen Fachinhalten „Thema” und „Topic” auseinandergesetzt. Darüber hinaus haben sie die Methode des Topic Modeling kennengelernt und anhand des DARIAH Topic Explorers selber ausprobiert. Beenden Sie die Sitzung, indem Sie auf Inhalte der nächsten Seminareinheit verweisen. Bis zur nächsten Sitzung sollen die Gruppen die Fragen beantwortet und eine ca. 10-minütige Präsentation mit Anschauungsmaterial (Exportfunktionen des Topics Explorers) sowie eine ausformulierte Musterlösung zu den Aufgaben vorbereitet haben. Die Erarbeitungsphase endet damit nicht mit dem Schluss der ersten Sitzung, sondern bildet ebenso die Grundlage der Hausaufgaben.

2.4 Sicherung

Die zweite Sitzung beginnt mit den Präsentationen der Arbeitsergebnisse der Kleingruppen. Diese finden nicht im Plenum statt, um eine zeitintensive und mehrfache Vorstellung ähnlicher oder gleicher Arbeitsergebnisse zu umgehen. Jeweils zwei Kleingruppen, die sich mit Schiller beschäftigt haben, und zwei Kleingruppen, die sich mit Hauff beschäftigt haben, bilden Teams und stellen sich ihre Ergebnisse gegenseitig vor (ca. 20 Minuten). Dabei sollen die Studierenden Erkenntnisse, Herausforderungen und Problemstellungen diskutieren, um eine gemeinsame Kurzpräsentation und Musterlösung zu erarbeiten. Die Methode Topic Modeling sollte in den neu zusammengesetzten Gruppen kritisch reflektiert werden, wobei die in der Erarbeitungsphase ausgeführten Aufgaben als Rahmen für diese Diskussionen fungieren.

Sie selbst gehen in dieser Phase von Gruppe zu Gruppe, hören bei den Diskussionen zu und geben Impulse. Diese Impulse sollten sowohl traditionell literaturwissenschaftlicher Art sein (Epochen-, Gattungs- und Autorenkenntnisse sind hier besonders relevant) als auch vor dem Hintergrund der Ihnen zur Verfügung gestellten Lösungsvorschläge für die Beispielaufgaben gegeben werden. Achten Sie darauf, dass in allen Gruppen eine Ergebnissicherung stattfindet – inhaltlicher Art wie auch in Bezug auf exportierte Daten aus dem Topics Explorer. Für die Gruppendiskussionen sollten Sie insgesamt ca. 50 Minuten veranschlagen.

2.5 Transfer & Reflexion

In den letzten 40 Minuten der Sitzung sollten schließlich die in der Sicherungsphase zu Tage getretenen Probleme und Erkenntnisse ins Plenum getragen und zusammenfassend diskutiert werden. Auf freiwilliger Basis sollte sich mindestens eine Schiller- und eine Hauff-Gruppe bereit erklären, ihre Ergebnisse zu präsentieren, sodass die anderen Gruppen kritisch dazu Stellung nehmen können. Die kurzen Vorträge (ca. 10 Minuten) sollten exportierte Grafiken enthalten und über Erwartungen und Überraschungen im Prozess des Topic Modelings informieren. Welche methodischen wie literaturhistorischen und gattungsspezifischen Erkenntnisse haben die Studierenden gewonnen? Was sind Gemeinsamkeiten und Unterschiede im Schiller- und Hauff-Korpus? Was wären alternative bzw. traditionelle Wege gewesen, um diese Erkenntnisse zu erlangen? Welche Textsammlungen würden die Studierenden außerdem gerne mit dem Topics Explorer untersuchen? Wenn die Diskussion sich zäh gestalten sollte, können Sie weitere Gruppen auffordern, ihre Ergebnisse zu präsentieren – auch wenn es hierbei stellenweise zu Wiederholungen kommen kann. Die erarbeiteten Musterlösungen können Sie zudem als Seminarleistung einsammeln.

Abschließend geben Sie Impulse für einen Transfer der erlernten Methodik. Fragen Sie, wie die Methode in etwaigen zu erstellenden Hausarbeiten oder in Bezug auf andere im Seminar behandelte Werke oder Fragestellungen fruchtbar gemacht werden kann. Betonen Sie dabei die Relevanz einer Kombination von traditionellem Fachwissen mit der neu erlernten Methode. Ein Distant-Reading-Verfahren wie das Topic Modeling kann z. B. den Blick auf einen Autor/eine Autorin, eine Epoche oder eine Gattung schärfen und erweitern. Kenntnisse, die man bei der intensiven – bspw. diskursanalytisch ausgerichteten – Lektüre eines Textes erwirbt, können durch Methoden des Distant Reading in einem größeren Kontext gespiegelt, verfeinert, evtl. sogar revidiert werden. Der Computer gibt nicht auf Knopfdruck literaturwissenschaftliches Fachwissen aus; vielmehr sollte der interpretatorisch überformte Modellierungsprozess im Topic Modeling als Pendant und mithin als Ergänzung zum traditionellen Close Reading gesehen werden.

3. Lösungen zu den Beispielaufgaben

Um Ihnen einen Unterricht zu ermöglichen, in dem Ihre Studierenden die Aufgaben selbstständig erarbeiten, stellen wir die Lösungsvorschläge nur Lehrenden zur Verfügung. Schreiben Sie uns daher einfach eine kurze Mail an info@fortext.net unter Angabe des Lehrmoduls, das Sie unterrichten wollen, und wir lassen Ihnen unsere Lösungsvorschläge schnellstmöglich zukommen.