DARIAH Topics Explorer

Der Workflow des DARIAH Topics Explorer: Ein Korpus aus mehreren Texten im TXT- oder XML-Format hochladen und die Parameter festlegen, Daten in Tabellenform und Visualisierungen auf dem Bildschirm ansehen und auswerten, oder eine ZIP-Datei mit Tabellendokumenten und Grafiken als HTML herunterladen.

Systemanforderungen: Der Topics Explorer läuft auf Windows-, Mac- und Linux-PCs, ist offline und ohne Installation nutzbar.
Stand der Entwicklung: Die Version 2.0 des Topics Explorers wurde im Dezember 2018 herausgebracht und wird auch weiterhin fortentwickelt.
Herausgeber: Severin Simmler für DARIAH-DE
Lizenz: kostenfrei
Weblink: https://github.com/DARIAH-DE/TopicsExplorer
Im- und Export: Der Topics Explorer benötigt mindestens 5 Textdokumente im TXT- oder XML- Format, um daraus Topics zu generieren. Die Daten und Visualisierungen können in unterschiedlichen Formaten heruntergeladen werden. Darunter HTML, Tabellenformate und Bildformate.

1. Für welche Fragestellungen kann der DARIAH Topics Explorer eingesetzt werden?

Der Topics Explorer eignet sich besonders zur explorativen Untersuchung von Fragen nach Themenfeldern in größeren Textsammlungen. Das können z. B. wiederkehrende Motive im Werk eines Autors sein oder Themen von Texten einer ganzen Epoche.

2. Welche Funktionalitäten bietet der DARIAH Topics Explorer und wie zuverlässig ist das Tool?

Funktionen:

Zuverlässigkeit: Der Topics Explorer wurde für DH-Einsteiger*innen entwickelt, die Topic Modeling mit Hilfe einer grafischen Nutzeroberfläche durchführen möchten. Das Tool ist nicht darauf ausgelegt, große Textsammlungen auszuwerten. Mit kleineren Sammlungen (bis zu 100 oder 200 Texte) läuft das Tool sehr zuverlässig. Die Erstellung der Topics läuft vergleichsweise zügig, kann jedoch nach Größe der Textsammlung variieren.

3. Ist der DARIAH Topics Explorer für DH-Einsteiger*innen geeignet?

Checkliste √ / teilweise /–
Methodische Nähe zur traditionellen Literaturwissenschaft
Grafische Benutzeroberfläche
Intuitive Bedienbarkeit
Leichter Einstieg
Handbuch vorhanden
Handbuch aktuell
Tutorials vorhanden
Erklärung von Fachbegriffen
Gibt es eine gute Nutzerbetreuung? teilweise

Der Topics Explorer setzt zwar keine technischen Fertigkeiten, dafür aber Grundkenntnisse in der Methodik des Topic Modeling voraus (vgl. → Topic Modeling). Fachbegriffe wie LDA werden genannt, aber nicht weiter erklärt. Alle erklärenden Texte sind in englischer Sprache verfasst. Die Nutzerbetreuung findet über GitHub statt und eine Problemlösung kann nach eigenen Angaben der Entwickler unterschiedlich viel Zeit in Anspruch nehmen.

4. Wie etabliert ist der DARIAH Topics Explorer in den (Literatur-)Wissenschaften?

Der Topics Explorer wurde im Frühjahr 2018 als Beta-Version und im Dezember desselben Jahres als Version 2.0 herausgegeben. Damit ist das Tool zum jetzigen Zeitpunkt noch sehr jung und wurde bisher nicht in literaturwissenschaftlichen Publikationen erwähnt.

5. Unterstützt der DARIAH Topics Explorer kollaboratives Arbeiten?

Nein, der Topics Explorer hat keine Funktionalitäten, die kollaborativ genutzt werden können.

6. Sind meine Daten beim DARIAH Topics Explorer sicher?

Ja. Für die Nutzung des Topics Explorers ist keine Angabe persönlicher Daten notwendig. Die verarbeiteten Textdaten bleiben auf dem eigenen PC. Die Nutzung des Topics Explorers ist also unter persönlichkeitsrechtlichen und auch unter urheberrechtlichen Gesichtspunkten unproblematisch.

7. Nachweise und weiterführende Literatur