Methoden

Auf dieser Seite bieten wir Ihnen Informationen zu digitalen Methoden und Arbeitsprozessen (in alphabetischer Reihenfolge), die der Analyse und Interpretation von Texten dienen, sowie zu vorbereitenden Prozeduren wie der Digitalisierung von Texten. In den Informationstexten finden sich darüber hinaus Links zu digitalen Tools, mit denen Sie die jeweiligen Methoden ausführen können.

Kollaboratives literaturwissenschaftliches Annotieren

4. April 2018
Annotation Flow Chart

Unter kollaborativem literaturwissenschaftlichem Annotieren ist eine Praxis kooperativen Arbeitens zu verstehen, bei der sich mehrere Forschende gemeinsam der Annotation literarischer Texte annehmen. Während hierbei unterschiedliche Modi der Kooperation möglich sind, widmet sich der vorliegende Beitrag ausschließlich einer spezifischen Unterform des kollaborativen Annotierens: der gemeinsamen Arbeit an derselben Textgrundlage vor dem Hintergrund derselben Fragestellung.

Manuelle Annotation

28. Januar 2018
manuelle digitale Annotation

Unter (digitalem) manuellem Annotieren versteht man die Praxis, in Texten digital Hervorhebungen oder Anmerkungen anzubringen. Diese können ganz unterschiedlichen Zwecken dienen – beispielsweise der Strukturierung von Texten, ihrer sprachlichen oder inhaltlichen Beschreibung, ihrer Kontextualisierung oder Interpretation.

Möglichkeiten der Textdigitalisierung

24. Januar 2018
Die Verwandlung analog zu digital

Textdigitalisierung bezeichnet den Prozess der Umwandlung eines gedruckten oder handschriftlichen Textes in einen maschinell lesbaren elektronischen Text. Je nach Beschaffenheit des Ausgangstextes kommen in diesem Prozess der Texterfassung bzw. Transkription mehrere potentielle Bearbeitungsschritte in Frage – automatisierte (optical character recognition (OCR): optische Zeichenerkennung) wie manuelle (keying).

Named Entity Recognition (NER)

17. Mai 2018
Screenshot

Named Entity Recognition (NER) ist ein Verfahren, mit dem klar benennbare Elemente (z.B. Namen von Personen oder Orten) in einem Text automatisch markiert werden können. Named Entity Recognition wurde im Rahmen der computerlinguistischen Methode des Natural Language Processing (NLP) entwickelt, bei der es darum geht, natürlichsprachliche Gesetzmäßigkeiten maschinenlesbar aufzubereiten.

Netzwerkanalyse

12. November 2018

Netzwerkanalyse ist eine Methode, bei der eine Fragestellung im Zentrum steht, in der es um die Relationen zwischen definierten Elementen geht (wie z. B. um die Figurenkonstellation in einem literarischen Werk). Solche Relationen stellt man sich in Form eines Netzwerks vor, das aus zuvor definierten Eckpunkten (Knoten) und deren Verbindungen untereinander (Kanten) aufgebaut wird. Im Mittelpunkt der Betrachtung stehen damit ein Beziehungsgeflecht und dessen quantitative und qualitative Merkmale.

Stilometrie

6. September 2018
Goethe consensus tree

In der digitalen Stilometrie werden Texte oder Textpassagen auf Grundlage statistischer Verteilungen (i. d. R. der häufigsten Wörter) stilistisch miteinander verglichen. So lässt sich beispielsweise die stilistische Entwicklung oder Differenzierung eines literarischen Textes, eines Oeuvres, oder gar einer ganzen Epoche quantitativ nachvollziehen. Insbesondere werden stilometrische Methoden bei Autorschaftsattributionen, Genreklassifikationen, Epochendifferenzierungen oder auch in der forensischen Linguistik eingesetzt.

Textvisualisierung

Visuelle Variablen (Bertin 1982)

Die Textvisualisierung als Teilbereich der Informationsvisualisierung befasst sich mit der visuellen Repräsentation komplexer Textdaten und der Manipulierbarkeit dieser Repräsentation durch interaktive Softwareinterfaces (vgl. Card et al. 1999). Visuelle Darstellungen können neue Einsichten in Textdaten und deren innere Zusammenhänge liefern.
Textvisualisierungen unterstützen sowohl die Kommunikation von Forschungsergebnissen als auch die explorative Analysetätigkeit.

Topic Modeling

15. Januar 2018
Topic Model

Topic Modeling ist ein auf Wahrscheinlichkeitsrechnung basierendes Verfahren zur Exploration größerer Textsammlungen. Das Verfahren erzeugt statistische Modelle (Topics) zur Abbildung häufiger gemeinsamer Vorkommnisse von Wörtern.