Systemanforderungen: Vorherige Installation von R bzw. RStudio (und für Mac-User*innen XQuartz); von dort kann das „stylo”-Package entweder aus CRAN oder GitHub installiert werden, oder auch aus einer lokal gespeicherten Datei (hierfür müssen Sie vorab zusätzliche R-Packages installieren: tcltk2, ape, class, e1071, pamr, tsne); Stylo ist mit allen Betriebssystemen nutzbar; zur Installation der Packages benötigen Sie eine Internetverbindung, ab dann kann Stylo offline verwendet werden (zur Verwendung von Stylo in der Programmiersprache Python siehe Calvo Tello 2017)
Stand der Entwicklung: Version 0.6.9 (Oktober 2018)
Herausgeber: Maciej Eder, Mike Kestemont, Jan Rybicki
Lizenz: Kostenfrei, Open Source
Weblink: https://github.com/computationalstylistics/stylo
Im- und Export: Import: Alle Dateien einer Textsammlung sollten das gleiche Format haben; die Entwickler empfehlen das TXT-Format (UTF8-codiert); auch möglich, aber weniger erprobt, sind HTML und TEI-XML; die einzelnen Dateien müssen nach dem Muster Kategorie_Titel.txt gespeichert werden, z. B. Bachmann_Malina.txt; Export: Ausgabe jedes Durchlaufs als txt-Datei; Visualisierungen: PDF, JPG, PNG, SVG (nützlich zur Einbindung in HTML-Codes oder weitere Verarbeitung)
Sprachen: Optimiert für Englisch, Latein, Polnisch, Ungarisch, Französisch, Italienisch, Spanisch, Holländisch, Deutsch, CJK (Chinesisch/Japanisch/Koreanisch auf Basis gleicher Zeichen), außerdem gibt es die Option „other" (inwiefern die Methode auch mit anderen Sprachen stabil läuft, sollte selbst getestet werden)
1. Für welche Fragestellungen kann Stylo eingesetzt werden?
Mit Stylo lassen sich alle Fragen der → Stilometrie bearbeiten. Dazu gehören vor allem Fragen der Autorschaftsattribution, Genre- oder Epochenklassifikationen, stilistische Entwicklungen eines Autorinnenoeuvres usw. Das Tool ermöglicht dabei die Anwendung unterschiedlicher in der Stilometrie diskutierter Algorithmen.
2. Welche Funktionalitäten bietet Stylo und wie zuverlässig ist das Tool?
Funktionen:
- Stilistische Vergleichsanalyse von Texten oder Textsegmenten anhand der häufigsten Wörter (MFW)
- Verschiedene gängige Statistiken sind implementiert
- Verschiedene Preprocessing-Maßnahmen sind im Programm inbegriffen, unter anderem ein Tokenizer und eine Pronomen-/Stoppwortliste für mehrere Sprachen (mit der Möglichkeit, die jeweiligen Wörter aus den Texten zu löschen)
- Variable Visualisierungsformen der Ergebnisse
Zuverlässigkeit: Stylo funktioniert je nach Größe Ihrer Textsammlung und vorgenommener Voreinstellungen zügig und zuverlässig. Die errechneten Ergebnisse sind je nach Datengrundlage und manuell vorgenommenen Voreinstellungen so gut wie die zugrunde gelegten stilometrischen Algorithmen (z. B. „Burrows’ Delta”). Diese Algorithmen sind nicht von oder für Stylo selbst entwickelt worden, sondern finden lediglich im Tool Verwendung. Als mathematische Formeln ergeben sie immer nur Annäherungswerte an tatsächliche Phänomene.
3. Ist Stylo für DH-Einsteiger*innen geeignet?
Checkliste | √ / teilweise / – |
---|---|
Methodische Nähe zur traditionellen Literaturwissenschaft | √ |
Grafische Benutzeroberfläche | √ |
Intuitive Bedienbarkeit | teilweise |
Leichter Einstieg | – |
Handbuch vorhanden | √ |
Handbuch aktuell | √ |
Tutorials vorhanden | √ |
Erklärung von Fachbegriffen | teilweise |
Gibt es eine gute Nutzerbetreuung? | √ |
Die Stylo zugrunde liegende Idee ist es, uns ohne Coding-Kenntnisse zu ermöglichen, hochfunktionale und komplexe Algorithmen der Stilometrie zu verwenden. Grundlegende Kenntnisse in der Programmiersprache R sind jedoch zum Installieren und Starten des Tools vonnöten. Das Preprocessing findet ebenfalls innerhalb des Programms und unabhängig von der jeweiligen Sprache statt. Eine Sammlung von Folien bildet ein Tutorial zum Einstieg. Das Handbuch ist darum bemüht, Fachbegriffe zu erklären, für Anfänger*innen mögen einige Erklärungen aber zu technisch sein. Bei Fragen oder Problemen gibt es zwar keine Helpdeskfunktion, Sie können die Entwickler von Stylo aber über GitHub und Twitter kontaktieren. Verhältnismäßig schnelle Hilfe erhält man auch in einem Google-Forum der Computational-Stylistics-Gruppe.
4. Wie etabliert ist Stylo in den (Literatur-)Wissenschaften?
Stylo ist für die digitale Stilometrie eines der etabliertesten Tools. Es findet in zahlreichen Projekten zur Autorschaftsattribution oder zum geschlechtsspezifischen Schreiben Anwendung. Methodisch reflektiert nutzen auch kombinierte Ansätze von Distant- und Close-Reading-Verfahren (sog. „mixed-methods") das Tool (vgl. z. B. Herrmann 2017). Wie die meisten digitalen Textanalysetools findet jedoch auch Stylo keine Erwähnung in Publikationen von Zeitschriften der traditionelleren Literaturwissenschaft.
5. Unterstützt Stylo kollaboratives Arbeiten?
Nein. Stylo wird als R-Package auf dem eigenen Computer ausgeführt und ermittelte Ergebnisse müssen individuell verteilt und diskutiert werden.
6. Sind meine Daten bei Stylo sicher?
Ja. Es werden keine personenbezogenen Daten erhoben. Da Stylo auf dem eigenen Rechner genutzt wird, müssen Sie Ihre Texte zudem nirgendwo hochladen, um sie stilometrisch zu erforschen.
7. Nachweise und weiterführende Literatur
- Calvo Tello, José (2017): „Using Stylo in Python“. URL: https://cligs.hypotheses.org/577 [Zugriff: 12.11.2018].
- Eder, Maciej, Jan Rybicki und Mike Kestemont (2016): „Stylometry with R: A Package for Computational Text Analysis“. In: The R Journal. 8 (1), 107–121.
- GitHub: https://github.com/computationalstylistics/stylo
- Eder, Maciej (2017): „Visualization in stylometry: Cluster analysis using networks“. In: Digital Scholarship in the Humanities. 32 (1), 50–64. DOI: 10.1093/llc/fqv061.
- Herrmann, Berenike J. (2017): „In a text bed with Kafka. Introducing a mixed-method approach to digital stylistics“. In: Digital Humanities Quarterly. 11 (4).
- Twitter: https://twitter.com/MaciejEder.