Voyant

Der Workflow von Voyant lässt sich in vier Schritte unterteilen: 1) Vorab: Vorbereitung der zu untersuchenden Textsammlung oder
Der Workflow von Voyant lässt sich in vier Schritte unterteilen: 1) Vorab: Vorbereitung der zu untersuchenden Textsammlung oder des Textes; 2) Input: Hochladen der Textdokumente; 3) Interface: „Architektur“ der Analyselandschaft gestalten, indem die Tools für die Panels ausgewählt werden; 4) Output: Export der Ergebnisse über den Exportbutton in jedem Panel

Systemanforderungen: Voyant ist webbasiert mit verschiedenen Browsern (Firefox, Internet Explorer, Google Chrome, Safari) nutzbar, während der VoyantServer als Desktopapplikation nach dem Download – als sogenannte Standalone-Version – auch offline verwendet werden kann. Der VoyantServer ist mit Mac-, Windows- oder Linux-Betriebssystemen nutzbar, wobei Java installiert sein muss.
Stand der Entwicklung: Im Jahr 2003 veröffentlicht, derzeitig läuft die Version Voyant 2. 4, die 28 Tools beinhaltet und stetig weiterentwickelt wird. Der VoyantServer 2. 4 M7 wurde im Juni 2018 veröffentlicht.
Herausgeber: Geoffrey Rockwell (University of Alberta) und Stéfan Sinclair (McGill University).
Lizenz: Voyant ist eine kostenlos nutzbare Open-Source-Software.
Weblink: Onlineversion: https://voyant-tools.org
Standalone-Version: https://github.com/voyanttools/VoyantServer
Im- und Export: Import durch die direkte Texteingabe in das Textfeld (Dateiformate: TXT, HTML, XML, Eingabe von URLs) oder durch das Hochladen der Dateien (Dateiformate:TXT, HTML, XML, PDF (geOCRt), RTF, RDF, Word, Excel, CSV, ODT, Pages, TEI, RSS, DToc, Atom- und Archivdateien wie z. B. ZIP, TAR, TGZ). Die Ergebnisse können als HTML-Quellcode, fertig generierte URL, bibliografische Zitation oder tabellarisierte bzw. rohe Datensätze exportiert werden (Dateiformate wie z. B. CSV). Jedes Tool weist in dem entsprechenden Panel einen tooleigenen Exportbutton auf. Über den generierten Link können einzelne Tools mit den individuellen Feineinstellungen weitergeleitet werden. Darüber hinaus kann über einen die gesamte Textsammlung betreffenden Exportbutton ein Link abgerufen werden, der die Textsammlung und die jeweils ausgewählten Tools – allerdings in ihren Grundeinstellungen – beinhaltet.
Sprachen: Siehe https://voyant-tools.org/docs/#!/guide/languages

1. Für welche Fragestellungen kann Voyant eingesetzt werden?

Voyant ist eine computerbasierte Textanalyselandschaft. Pro Arbeitseinheit lassen sich jeweils fünf unterschiedliche Tools miteinander kombinieren, die eine quantitative Untersuchung von Texten oder Textsammlungen sowie verschiedene Formen der → Textvisualisierung ermöglichen. Gängige Fragestellungen sind zum Beispiel: Welche Begriffe werden in einem Text oder einer Textsammlung am häufigsten verwendet? In welchem Kontext kommen ausgewählte Wörter vor? Auf welche Art und Weise ballen sich Wörter in einer Textsammlung zusammen? Welche Verbindungen bestehen zwischen Figuren, Orten oder Organisationen?

2. Welche Funktionalitäten bietet Voyant und wie zuverlässig ist das Tool?

Funktionen: Voyant, dessen originär englisches Interface mittlerweile in neun weitere Sprachen übersetzt wurde, ermöglicht die Untersuchung, Analyse und Visualisierung zweier vorbereiteter Textsammlungen – bestehend aus acht Werken Jane Austens oder aus 27 Werken Shakespeares – oder die Arbeit an eigens zusammengestellten Textsammlungen (z. B. → TextGrid Repository, → Deutsches Textarchiv (DTA)). Je nach Auswahl der Tools bietet Voyant eine Vielzahl von Funktionen, dazu zählen:

  • Verschiedene Formen der Tokenisierung, also die Segmentierung des Textes in einzelne Wörter
  • Erstellen erweiterbarer Stoppwortlisten
  • unterschiedliche Varianten der Analyse, die sich gegenseitig beeinflussen (Wortsuche, Wortkontexttools, Häufigkeit von Wörtern und Phrasen in einer Sammlung oder einem Text)
  • Zahlreiche Formen der Visualisierung

Zuverlässigkeit: Voyant arbeitet relativ zuverlässig. Bei der Implementierung großer Textsammlungen kann es allerdings zu Verzögerungen, Ausfällen oder Fehlermeldungen kommen. Darüber hinaus sind einige Tools noch nicht vollends funktionstüchtig, worauf die Entwickler jedoch hinweisen. Die Visualisierungen einiger Tools – wie z. B. TextualArc oder Knots – können auf den ersten Blick überladen und unübersichtlich wirken. Da die Interpretation der Ergebnisse einen wichtigen Teil der Arbeit mit Voyant darstellt, empfiehlt es sich für Einsteiger*innen, zunächst auf die gängigen und einfach auszuwertenden Tools (z. B. Summary, Cirrus, ScatterPlot) zurückzugreifen oder die bestehende Benutzeroberfläche beizubehalten (Cirrus, Reader, Trends, Summary, Contexts).

3. Ist Voyant für DH-Einsteiger*innen geeignet?

Checkliste √ / teilweise / –
Methodische Nähe zur traditionellen Literaturwissenschaft teilweise
Grafische Benutzeroberfläche
Intuitive Bedienbarkeit
Leichter Einstieg
Handbuch vorhanden
Handbuch aktuell
Tutorials vorhanden
Erklärung von Fachbegriffen teilweise
Gibt es eine gute Nutzerbetreuung? teilweise

Voyant ermöglicht einen Brückenschlag zwischen innovativen digitalen Analyseverfahren von Texten und deren (literaturwissenschaftlicher) Interpretation. Hierbei steht die computerbasierte Textanalyse durch die Erhebung statistischer Daten im Fokus, deren Interpretation in einem zweiten Schritt und quasi offline – nämlich durch die Nutzer*innen – geschieht. Die methodische Nähe zur traditionellen Literaturwissenschaft besteht vor allem in der Interpretation der erhobenen Daten.
Kleinere Hilfestellungen und Erklärungen, deren Lesbarkeit durch eine zu kurze Anzeigezeit allerdings erschwert wird, sind als fester Bestandteil der GUI jedem Panel beigefügt und leiten bei Bedarf zum Handbuch weiter. Rückfragen oder Anmerkungen sind über Twitter und GitHub möglich, eine Mailadresse für Anfragen oder andere Formen der Unterstützung werden derzeit nicht angeboten.

4. Wie etabliert ist Voyant in den (Literatur-)Wissenschaften?

Voyant ist in den Wirkungsfeldern der digitalen Geisteswissenschaften fest etabliert. Der in Zusammenarbeit der DARIAH-DE mit TextGrid und Voyant entwickelte fachwissenschaftliche Dienst „DIGIVOY: TextGrids Digitale Bibliothek mit Voyant entdecken“ ermöglicht die direkte Untersuchung, Analyse und Visualisierung der digitalen Bibliothek des TextGridRepository mittels der Voyant-Tools.
Da digitale Texte allgegenwärtig sind, wird Voyant darüber hinaus in verschiedenen Sachgebieten eingesetzt. Im Oktober 2016 wurde der Voyant Server von 81.686 Menschen aus insgesamt 156 Ländern besucht, wobei 1.173.252 Tool-Anwendungen umgesetzt wurden und der VoyantServer über 2000 Mal heruntergeladen wurde. Darüber hinaus ist Voyant auf der Homepage von sechs Universitätsbibliotheken als wichtige Ressource aufgelistet. Der Einbezug in fachdidaktische Unterrichtskonzeptionen (vgl. Lechner et al. 2018; Kemann 2016; Kühner 2017), journalistische Arbeiten (vgl. Sinclair und Rockwell 2012, 19) oder kreative Projekte (vgl. Sample 2013) verweist auf die mannigfachen Anwendungsbereiche des Tools. Ein Blick auf eine Auswahl von Blog-Posts, Artikeln, Kongressen, Workshops, Praxisbeispielen aus Schulen und Universitäten, in denen Voyant-Tools auf unterschiedliche Art und Weise Anwendung finden, verdeutlicht, dass Voyant kein reines Werkzeug der digitalen Geisteswissenschaften darstellt. Der Leitspruch “see through your text” lässt sich mittels der Voyant-Tools in ganz unterschiedlichen Kontexten in die Tat umsetzten.

5. Unterstützt Voyant kollaboratives Arbeiten?

Nein, der Arbeitsmodus mit Voyant ist die Einzelarbeit.

6. Sind meine Daten bei Voyant sicher?

Voyant liegt auf keinem gesicherten Server. Das Tool wurde in Kanada entwickelt, die entsprechenden Server befinden sich außerhalb der EU. Um Datenschutz und Sicherheit zu erhöhen, empfiehlt sich die Installation des VoyantServers, der offline und auf dem eigenen Rechner ausgeführt wird. Angaben zu der eigenen Person müssen weder für die Verwendung des VoyantServers noch für die Nutzung der webbasierten Version gemacht werden. Die IP-Adresse wird erhoben, um den Verlauf der Arbeitssitzungen nachvollziehen zu können. Zwecks Tooloptimierung, Bugentfernung und Ermittlung der Toolanwendungen wird Google Analytics verwendet. Sofern Daten für Forschungszwecke herangezogen werden, geschieht dies in anonymisierter wie aggregierter Form. Bei der Nutzung von Voyant werden somit Datenschutzrechte geltend gemacht, die nicht den europäischen Standards entsprechen. Auf diesen Sachverhalt wird in der Datenschutzerklärung mit dem Verweis auf die spezifischen Datenschutzrichtlinien von Google hingewiesen. Die bearbeitete Textgrundlage wird gespeichert, um eine weiterführende Bearbeitung zu ermöglichen. Der hierfür zufällig generierte Link kann zusätzlich mit einem Zugangspasswort versehen werden. Sofern ein Link mindestens einmal im Monat aufgerufen wird, kann die Speicherung der hinterlegten Daten andauern. Texte oder Textsammlungen können auf Nachfrage per E-Mail gelöscht werden.

7. Nachweise und weiterführende Literatur

  • Kemann, Max (2016): A Republic of Emails: What are the contents. URL: https://www.maxkemman.nl/2016/11/a-republic-of-emails-what-are-the-contents/ [Zugriff: 25.10.2018].
  • Kühner, Janina (2017): „Fachdidaktisches Essay: Beispielhafte Konzeption einer Literaturunterrichtseinheit mit Voyant“. In: Skriptum. 6 (1), 41–57.
  • Lechner, Renée, Urs Henning und Emil Müller (2018): „Distant Reading mit Voyant“. In: Web2-Unterricht, URL: https://web2-unterricht.ch/2018/05/distant-reading-mit-voyant/ [Zugriff: 25.10.2018].
  • Herrmann, J.B. (2012): „Literatur rechnen. Ein Wiki zur digitalen Textanalyse“. URL: http://litre.uni-goettingen.de/index.php/Hauptseite [Zugriff: 25.10.2018].
  • Sample, Mark (2013): „no life no life no life no life: the 100,000,000,000,000 stanzas of House of Leaves of Grass“. In: @samplereality, URL: http://www.samplereality.com/2013/05/08/no-life-no-life-no-life-no-life-the-100000000000000-stanzas-of-house-of-leaves-of-grass/ [Zugriff: 23.10.2018].
  • Samsel, Laurie (2018): „Voyant Tools“. In: Music References Services Quarterly. 21 (3), 153–157. DOI: 10.1080/10588167.2018.1496754. 
  • Sinclair, Stefan und Geoffrey Rockwell (2012): „Teaching Computer-Assisted Text Analysis: Approaches to Learning New Methodologies“. In: Hirsch, Brett D. (Hrsg.) Digital Humanities Pedagogy: Practices, Principles and Politics, Bd. 3. OpenBook Publishers.
  • Sinclair, Stéfan und Geoffrey Rockwell (2016): „Text Analysis and Visualization: Making Meaning Count“. In: Susan Schreibman; Ray Siemens und John Unsworth (Hrsg.): A New Companion to Digital Humanities. 274–290.
  • Sinclair, Stéfan und Geoffrey Rockwell (2016): Hermeneutica. Computer-Assisted Interpretations in the Humanities. The MIT Press.

Weiterführende Links