Der forTEXT-Projektpilot

Digitale Routinen, Ressourcen und Tools können die meisten geisteswissenschaftlichen Projekte sinnvoll unterstützen. Wenn Sie erst wenig oder keine Vorerfahrungen mit digitalen Methoden (z. B. Arbeit mit einem Textanalysetool oder der Nutzung digitaler Repositorien) haben, bietet der folgende Fragebogen Ihnen Unterstützung.

Um Ihnen möglichst relevante Vorschläge machen zu können, möchten wir gerne mehr über Ihr Vorhaben erfahren und haben daher ein paar Fragen für Sie vorbereitet.
Viel Spaß!

Forschung oder Lehre

A. Forschung

Status des Vorhabens

Bitte beachten Sie: Die Vorschläge sind jeweils auf die Projektphase ausgelegt, in der Sie sich gerade befinden. Wenn Sie Empfehlungen für eine weitere Projektphase bekommen möchten, können Sie den Fragebogen einfach ein weiteres Mal ausfüllen.

Konzeption: In unserem Methodeneintrag Projektkonzeption erfahren Sie, welche Besonderheiten Sie bei der Konzeptionierung eines literaturwissenschaftlichen Projekts beachten müssen, in dem digitale Routinen, Ressourcen oder Tools zum Einsatz kommen sollen. Außerdem erhalten Sie darin Empfehlungen, wie Sie in der Konzeptionierungsphase eines Projekts digitale Unterstützung nutzen können. Ein geeignetes Tool könnten in dieser Projektphase Trello sein.

Dokumentation und Publikation: In unserem Methodeneintrag Digitales Präsentieren und Publizieren erfahren Sie, wie Sie in dieser Projektphase digitale Unterstützung nutzen können. Ein geeignetes Tool für die Erstellung von visuellen Präsentationen, etwa als Unterstützung von Vorträgen, ist beispielsweise Prezi.

Korpusbildung und Bibliographieren

Nein: Unser Methodeneintrag Korpusbildung enthält Informationen darüber, was Sie bei der Auswahl der Primärtexte in einem digital unterstützten Projekt beachten müssen und welche Unterstützung Sie in diesem Arbeitsschritt heranziehen können.

Nein: Der Methodeneintrag Digitales Bibliografieren erläutert, wie Sie den Arbeitsschritt des systematischen Zusammenstellens von Literaturverzeichnissen digital unterstützen können. Zwei Tools unter vielen, die Sie für das digitale Bibliografieren nutzen können, sind Zotero und Citavi. Eine geeignete Ressource ist Germanistik im Netz.

Nein: Damit Sie Texte digital erforschen können, müssen diese Texte in digitalisierter Form vorliegen. Wie Sie Texte selbst digitalisieren können und was Sie dabei beachten müssen, erfahren Sie in unserem Methodeneintrag Möglichkeiten der Textdigitalisierung (siehe auch die Lerneinheiten Manuskriptdigitalisierung mit Transkribus und Digitalisierung mit ocr4all sowie die Video-Tutorial-Reihe Digitalisierung und Literaturanalyse). Tools, die Sie für die Textdigitalisierung nutzen können, sind beispielsweise Abbyy FineReader, Transkribus oder ocr4all.

Wie Sie herausfinden können, ob Ihnen eine Bild- oder eine Textdatei vorliegt, ist in Absatz 12 des Methodeneintrags Digitale Manuskriptanalyse beschrieben: "Haben Sie ein eingescanntes Manuskript als Datei vorliegen, testen Sie zunächst, ob es sich um eine Bilddatei oder ein computerlesbares Dokument handelt, indem Sie versuchen, einzelne Zeilen des Dokumentes zu markieren. Wird die gesamte Seite blau/ausgewählt, handelt es sich um eine Bilddatei (d. h. die Schrift ist für den Computer noch nicht lesbar); werden nur die von Ihnen markierten Zeilen blau bzw. ausgewählt, hat bereits eine OCR (optical character recognition) bzw. eine HTR (handwritten text recognition) stattgefunden (d. h. der Text des jeweiligen Dokumentes ist digitalisiert und als elektronischer Text vom Computer les- und analysierbar)."

Als Bild: Wenn Ihre Texte als Bilddateien digitalisiert sind, stehen Ihnen viele Möglichkeiten der digital gestützten Textanalyse nicht offen. Sie können Ihre Texte allerdings als Bilder bzw. Manuskripte mit zusätzlichen Daten anreichern und diese dann für eine (teil-)automatisierte Analyse nutzen. Hierum geht es unter anderem in unserem Methodeneintrag Digitale Manuskriptanalyse. Ein Tool, das hierfür genutzt werden kann, ist Transkribus. Wenn Sie weitere Optionen der digital gestützten Textanalyse nutzen möchten, benötigen Sie maschinenlesbare Dokumente. Wie Sie diese selbst erstellen können, beschreibt unser Methodeneintrag Möglichkeiten der Textdigitalisierung (siehe auch die Lerneinheiten Manuskriptdigitalisierung mit Transkribus und Digitalisierung mit ocr4all sowie die Video-Tutorial-Reihe Digitalisierung und Literaturanalyse). Tools, die Sie für die Textdigitalisierung nutzen können, sind beispielsweise Abbyy FineReader, Transkribus oder ocr4all.

Die Qualität maschinenlesbarer Texte, die sich beispielsweise online in digitalisierter Form finden lassen, schwankt teilweise erheblich. Grund dafür sind meist Fehler bei der automatischen Texterkennung während des Scanvorgangs. Da auch die automatische Angabe von Fehlerquoten, die manche OCR-Programme anbieten, mit Vorsicht zu genießen ist, testen Sie die Qualität der Digitalisate, mit denen Sie arbeiten möchten, am besten (stichprobenartig) selbst. Weitere Informationen kann Ihnen das OCR-D-Projekt liefern.

Ja: Sie haben die Texte, die Sie für Ihr Projekt benötigen, identifiziert und als maschinenlesbare Digitalisate vorliegen. Wenn Sie im nächsten Schritt Ihre Texte mit digitaler Unterstützung erforschen möchten, dann können Sie unseren Fragebogen erneut starten.

Nein: Ob Sie sinnvoll mit fehlerhaft digitalisierten Texten arbeiten können, hängt von der Fehlerquote und Ihrem Projektdesign ab. Wenn Sie die Texte lieber selbst digitalisieren möchten, um sicherzugehen, können Sie unseren Methodeneintrag Möglichkeiten der Textdigitalisierung konsultieren (siehe auch die Lerneinheiten Manuskriptdigitalisierung mit Transkribus und Digitalisierung mit ocr4all sowie die Video-Tutorial-Reihe Digitalisierung und Literaturanalyse). Tools, die Sie für die Textdigitalisierung nutzen können, sind beispielsweise Abbyy FineReader, Transkribus oder ocr4all.

Ja: Von den weiter oben vorgeschlagenen Tools unterstützen Zotero, Citavi, Transkribus und ocr4all kollaboratives Arbeiten.

Mediävistische Literaturwissenschaft: Um herauszufinden, ob die Texte, die Sie für Ihr Projekt benötigen, bereits in digitaler Form vorliegen, können Sie geeignete digitale Textsammlungen durchforsten. Obwohl die folgenden Textsammlungen vorrangig Texte der neueren deutschen Literatur enthalten, können Sie hier auch nach geeigneten Texten für Ihr Projekt suchen: Germanistik im Netz, Bibliotheca Augustana, HathiTrust Digital Library.

Neuere Literaturwissenschaft: Um herauszufinden, ob die Sekundärtexte, die Sie für Ihr Projekt benötigen, bereits in digitaler Form vorliegen, können Sie geeignete digitale Textsammlungen durchforsten. Für Ihre Fachrichtung bieten sich beispielsweise folgende Textsammlungen für theoretische und Sekundärliteratur an: Germanistik im Netz, HathiTrust Digital Library, Bibliotheca Augustana.

Lyrik: In folgenden Textsammlungen und Datenbanken könnten Sie nach geeigneten Primärtexten suchen.

Prosa: In folgenden Textsammlungen und Datenbanken könnten Sie nach geeigneten Primärtexten suchen.

Dramatische Texte: In folgenden Textsammlungen und Datenbanken könnten Sie nach geeigneten Primärtexten suchen.

Keine bestimmte Gattung: In folgenden Textsammlungen und Datenbanken könnten Sie nach geeigneten Primärtexten suchen.

Auswerten von theoretischer oder Sekundärliteratur

Texte lesen und auszeichnen, Auszeichnungen auswerten: Für die Annotation von Manuskripten und die digitale Manuskriptanalyse eignet sich beispielsweise das Tool Transkribus. Für die manuelle Annotation eignen sich beispielsweise Tools wie WebAnno und CATMA (siehe auch die Lerneinheit Annotieren mit CATMA). Schauen Sie sich hierzu auch unseren Beitrag Ontologieentwicklung an. Möglicherweise ist für Sie auch das Tagset Interpretationstexte analysieren interessant, das beispielsweise in CATMA genutzt werden kann.

Textvisualisierung kann Ihnen helfen, Ihre Text- und Annotationsdaten zu erkunden. Dafür eignen sich beispielsweise Tools wie Stereoscope oder CATMA (siehe auch die Lerneinheiten Analyse und Visualisierung mit CATMA, Visualisierung mit CATMA und Stereoscope und Korpusanalyse mit CATMA sowie die Video-Tutorials Manuelle Annotation und Literaturanalyse). Eine spezielle Form der Visualisierung, mit der Sie Ihre Annotationsdaten analysieren können, ist die Netzwerkanalyse. Hierfür eignen sich beispielsweise Tools wie ezlinavis und Gephi (siehe auch die Lerneinheit Netzwerkanalyse mit Gephi sowie die Video-Tutorial-Reihe Netzwerkanalyse und Literaturanalyse).

Eigene Routinen zur Texterkundung entwickeln: Genaueres zur Entwicklung automatischer Routinen erfahren Sie in unserem Methodeneintrag Automatisierung.

Linguistische Eigenschaften: Tools, mit denen Sie Texte automatisch anhand linguistischer Kategorien auszeichnen lassen können, sind beispielsweise WebLicht und WebAnno. Ergänzende Informationen über einzelne analysierte Wörter können Sie im DWDS erhalten. Sie können außerdem prüfen, ob Ihre Texte im DTA verfügbar sind – dort sind die Texte bereits mit zahlreichen Metadaten versehen.

Worthäufigkeiten, -verteilungen und -kontexte können Sie beispielsweise mit Tools wie Voyant oder CATMA erkunden (siehe auch die Lerneinheiten Visualisierung mit VoyantAnalyse und Visualisierung mit CATMA und Visualisierung mit CATMA und Stereoscope sowie die Video-Tutorial Reihen Visualisierung und Literaturanalyse, und Annotation und Literaturanalyse). Eine komplexe Methode der Erkundung von Wortkontexten ist Word2Vec. Sie ist allerdings nur bei sehr großen Textmengen nutzbar.

Personen, Orte u.a. Entitäten: Named Entity Recognition ist eine digitale Methode zur automatischen Erkennung und Auszeichnung benannter Entitäten wie Personen, Orten oder Organisationen. Geeignete Tools sind beispielsweise der Stanford Named Entity Recognizer, WebLicht und WebAnno (siehe auch die Lerneinheit Named Entity Recognition mit dem Stanford Named Entity Recognizer sowie die Video-Tutorial-Reihe Named Entity Recognition und Literaturanalyse).

Beziehungen und Netzwerke zwischen Entitäten: Die digitale Netzwerkanalyse liefert unterschiedliche Möglichkeiten zur Erkundung der Konstellationen zwischen Personen, Konzepten oder anderen Entitäten. Geeignete Tools sind beispielsweise ezlinavis oder Gephi (siehe auch die Lerneinheit Netzwerkanalyse mit Gephi sowie die Video-Tutorial-Reihe Netzwerkanalyse und Literaturanalyse).

Stilistisches: Eine digitale Methode für die statistikbasierte Stilanalyse ist die Stilometrie. Stilometrische Untersuchungen lassen sich beispielsweise mit dem Tool Stylo durchführen (siehe auch die Lerneinheit Stilometrie mit Stylo sowie die Video-Tutorial-Reihe Stilometrie und Literaturanalyse).

Themen: Für die statistikbasierte Erforschung von Themen in Texten eignet sich die digitale Methode des Topic Modeling. Hierfür können Sie beispielsweise den DARIAH Topics Explorer nutzen (siehe auch die Lerneinheit Topic Modeling mit dem DARIAH Topics Explorer sowie die Video-Tutorial-Reihe Topic Modeling und Literaturanalyse).

Emotionale Dimensionen: Mithilfe der Sentimentanalyse können emotionale Dimensionen von Texten erkundet werden. Hierfür eignen sich zum Beispiel Tools wie LIWC. In die Nutzung des Tools können Sie sich mithilfe der Lerneinheit Sentimentanalyse einarbeiten.

Ja: Von den oben vorgeschlagenen Tools unterstützen Transkribus, CATMA und WebAnno kollaboratives Arbeiten.

Die Besonderheiten der kollaborativen Textauszeichnung und -auswertung sind in unserem Methodeneintrag Kollaborative Annotation beschrieben.

Ja: Von den oben vorgeschlagenen Tools unterstützt leider keines das kollaborative Arbeiten. Behelfen könnten Sie sich möglicherweise damit, die Exportfunktion solcher Tools zu nutzen, um Ihre Daten extern zu speichern und an Ihre Kolleg*innen weiterzugeben. Diese können die Daten dann bei Bedarf wieder in das Tool importieren und daran weiterarbeiten. Solch eine Behelfsmethode erfordert allerdings eine sorgfältige Dokumentation der unterschiedlichen Versionen Ihrer Arbeitsdaten sowie intensive Kommunikation zwischen den Teammitgliedern.

Diachrones Korpus: Wie Sie auch in unserem Methodeneintrag Korpusbildung erfahren können, ist insbesondere bei der automatisierten Analyse diachroner Textsammlungen zu beachten, dass sich Schreibweisen desselben Wortes unterscheiden können. Hierdurch können Analyseergebnisse möglicherweise verfälscht werden. In manchen digitalen Textsammlungen, beispielsweise im DTA, finden Sie immer standardisierte Fassungen der Texte. Wenn Sie digitale Texte aus anderen Quellen beziehen, könnte es empfehlenswert sein, die Texte in einem vorbereitenden Schritt teilautomatisiert auszuzeichnen, um gleiche Wörter in unterschiedlicher Schreibweise als zusammengehörig zu markieren. Dies ist beispielsweise mit dem Tool CATMA möglich (siehe auch die Lerneinheiten Annotieren mit CATMA und Analyse und Visualisierung mit CATMA sowie die Video-Tutorial Reihe Annotation und Literaturanalyse).

Ja: Da in der Ersten Orthographischen Konferenz von 1876 erstmals eine einheitliche Rechtschreibung für die deutsche Sprache festgelegt wurde, kann in Texten, die aus dem Zeitraum vor diesem Datum stammen, die Schreibweise desselben Wortes variieren (vgl. Methodeneintrag Korpusbildung). Hierdurch können Analyseergebnisse möglicherweise verfälscht werden. In manchen digitalen Textsammlungen, beispielsweise im DTA, finden Sie immer standardisierte Fassungen der Texte. Wenn Sie digitale Texte aus anderen Quellen beziehen, könnte es empfehlenswert sein, die Texte in einem vorbereitenden Schritt teilautomatisiert auszuzeichnen, um gleiche Wörter in unterschiedlicher Schreibweise als zusammengehörig zu markieren. Dies ist beispielsweise mit dem Tool CATMA möglich (siehe auch die Lerneinheiten Annotieren mit CATMA und Analyse und Visualisierung mit CATMA sowie die Video-Tutorial Reihe Annotation und Literaturanalyse).

Wie Sie auf Basis theoretischer Texte eine Ontologie bzw. ein Tagset für die Analyse von Primärtexten erstellen können, erfahren Sie im Methodeneintrag Ontologieentwicklung. Als Tools für die Erstellung von Ontologien können Sie Annotationstools wie CATMA, WebAnno oder INCEpTION nutzen. Für sehr komplexe Ontologien kann Protégé verwendet werden.

Auswerten von Primärtexten

Bis 200 Seiten: Bei gut überschaubaren Textmengen können auch und insbesondere sogenannte Close-Reading-Methoden gut für die Texterforschung genutzt werden. Hierbei müssen die Texte sorgfältig gelesen und per Hand ausgezeichnet werden, bevor automatische Analysemethoden zum Einsatz kommen können. Einige Distant-Reading-Methoden – bei denen unterschiedliche Textaspekte statistikbasiert und automatisiert ausgewertet werden – führen nur bei (sehr) großen Textmengen zu sinnvollen Ergebnissen.

Mehr als 200 Seiten: Wenn Sie große Textmengen erforschen wollen, empfehlen sich zunächst eher keine sogenannten Close-Reading-Methoden, bei denen die Texte sorgfältig gelesen und per Hand ausgezeichnet werden müssen, bevor automatische Analysemethoden zum Einsatz kommen können. Eine Möglichkeit wäre allerdings, Ihre Textsammlung zunächst mit automatisierten, Distant-Reading-Methoden zu erforschen, um dann auf der Basis der Ergebnisse einzelne Texte oder Textabschnitte für ein Close Reading auszuwählen. Eine weitere Möglichkeit, im Rahmen von Close-Reading-Ansätzen etwas größere Textmengen zu bewältigen ist kollaboratives Arbeiten.

Quantitativ-empirisch: Für grundlegende Untersuchungen Ihrer Texte, die beispielsweise auf der Häufigkeit der vorkommenden Worte basieren, eignen sich Tools wie CATMA oder Voyant (siehe auch die Lerneinheiten Analyse und Visualisierung mit CATMA, Visualisierung mit CATMA und Stereoscope, Korpusanalyse mit CATMA und Visualisierung mit Voyant sowie die Video-Tutorial-Reihen Visualisierung und Literaturanalyse und Annotation und Literaturanalyse. Eine Vielzahl automatisierter linguistischer Analyse- und Auszeichnungsroutinen liefert die Toolsuite WebLicht, und auch bei WebAnno und INCEpTION finden Sie entsprechende Funktionen. Die dort angebotenen sogenannten Preprocessing-Routinen bereiten digitalisierte Texte außerdem für die Nutzung vieler weiterer Distant-Reading-Methoden vor. Das Tool CorpusExplorer bietet ebenfalls unterschiedliche grundlegende Analyse- und Visualisierungsmöglichkeiten für Textkorpora. Wenn Sie speziell an einem wortbasierten Vergleich unterschiedlicher Versionen einen Textes interessiert sind, könnte das Tool CollateX für Sie interessant sein.

Diese Verfahren können problemlos auch bei kleineren Textmengen angewandt werden.

Analytisch-deskriptiv: Distant-Reading-Methoden, die Sie – insbesondere bei großen Textmengen – bei der deskriptiven Inhaltsanalyse unterstützen können, sind beispielsweise Named Entity Recognition, bei der Figuren, Orte und Organisationen in Texten automatisch identifiziert und ausgezeichnet werden, oder die Netzwerkanalyse, die eine Erforschung von (Figuren-)Konstellationen unterstützt. Geeignete Tools hierfür sind der Stanford Named Entity Recognizer bzw. ezlinavis und Gephi (siehe auch die Lerneinheiten Named Entity Recognition mit dem Stanford Named Entity Recognizer und Netzwerkanalyse mit Gephi sowie die Video-Tutorial-Reihen Netzwerkanalyse und Literaturanalyse und Named Entity Recognition und Literaturanalyse, ebenso wie die Video-Fallstudien Analyse der Figurenetzwerke in Lessings Emilia Galotti und Konstellationen bei Goethe und Plenzdorf). Für die quantitative Dramenanalyse kann zudem Katharsis genutzt werden.

Für eine analytisch-deskriptive Texterforschung kleinerer Textmengen eignet sich beispielsweise die manuelle Annotation und Analyse mithilfe von Tagsets, also (mehr oder weniger hierarchisch organisierten) Analysekategorien. Schauen Sie sich hierzu auch unseren Beitrag Ontologieentwicklung an. Für die digitale Annotation eignen sich Tools wie CATMA, WebAnno oder INCEpTION (siehe auch die Lerneinheit Annotation mit CATMA sowie die Video-Tutorial-Reihe Annotation und Literaturanalyse). Für die digitale Gedichtanalyse, insbesondere die Analyse von Klangstrukturen in (englischsprachigen) Gedichten, kann das Tool Poemage genutzt werden.

Interpretativ: Insbesondere Distant-Reading-Verfahren können im Zusammenhang mit genuin interpretativer literaturwissenschaftlicher Texterforschung nur als Heuristik dienen. Potentiell liefern viele Tools und Methoden interessante Einstiegsmöglichkeiten in Ihre Interpretation. Explorativ nutzen können Sie beispielsweise:

Zusätzlich oder alternativ kann Sie die manuelle Annotation bei Ihrer Textinterpretation unterstützen. Hier sind insbesondere Annotationstools geeignet, die ‘undogmatisches’ Annotieren erlauben – also Tools, die beispielsweise mehrere Annotationsmodi anbieten (tagset-/taxonomiebasiert und freie Kommentare), die freie Tagseterstellung erlauben (siehe auch Ontologieentwicklung) und überlappende bzw. widersprüchliche Annotationen zulassen. Ein solches Tool ist zum Beispiel CATMA (siehe auch die Lerneinheiten Annotation mit CATMA und Analyse und Visualisierung mit CATMA sowie die Video-Tutorial-Reihe Annotation und Literaturanalyse).

Interpretativ: Insbesondere Distant-Reading-Verfahren können im Zusammenhang mit genuin interpretativer literaturwissenschaftlicher Texterforschung nur als Heuristik dienen. Potentiell liefern viele Tools und Methoden interessante Einstiegsmöglichkeiten in Ihre Interpretation. Explorativ nutzen können Sie beispielsweise:

Zusätzlich oder alternativ kann Sie die manuelle Annotation bei Ihrer Textinterpretation unterstützen. Hier sind insbesondere Annotationstools geeignet, die ‘undogmatisches’ Annotieren erlauben – also Tools, die beispielsweise mehrere Annotationsmodi anbieten (tagset-/taxonomiebasiert und freie Kommentare), die freie Tagseterstellung erlauben (siehe auch Ontologieentwicklung) und überlappende bzw. widersprüchliche Annotationen zulassen. Ein solches Tool ist zum Beispiel CATMA (siehe auch die Lerneinheiten Annotation mit CATMA und Analyse und Visualisierung mit CATMA sowie die Video-Tutorial-Reihe Annotation und Literaturanalyse).

Interpretativ: Insbesondere Distant-Reading-Verfahren können im Zusammenhang mit genuin interpretativer literaturwissenschaftlicher Texterforschung nur als Heuristik dienen. Potentiell liefern viele Tools und Methoden interessante Einstiegsmöglichkeiten in Ihre Interpretation. Explorativ nutzen können Sie beispielsweise:

Zusätzlich oder alternativ kann Sie die manuelle Annotation bei Ihrer Textinterpretation unterstützen. Hier sind insbesondere Annotationstools geeignet, die ‘undogmatisches’ Annotieren erlauben – also Tools, die beispielsweise mehrere Annotationsmodi anbieten (tagset-/taxonomiebasiert und freie Kommentare), die freie Tagseterstellung erlauben (siehe auch Ontologieentwicklung) und überlappende bzw. widersprüchliche Annotationen zulassen. Ein solches Tool ist zum Beispiel CATMA (siehe auch die Lerneinheiten Annotation mit CATMA und Analyse und Visualisierung mit CATMA sowie die Video-Tutorial-Reihe Annotation und Literaturanalyse).

Interpretativ: Insbesondere Distant-Reading-Verfahren können im Zusammenhang mit genuin interpretativer literaturwissenschaftlicher Texterforschung nur als Heuristik dienen. Potentiell liefern viele Tools und Methoden interessante Einstiegsmöglichkeiten in Ihre Interpretation. Explorativ nutzen können Sie beispielsweise:

Zusätzlich oder alternativ kann Sie die manuelle Annotation bei Ihrer Textinterpretation unterstützen. Hier sind insbesondere Annotationstools geeignet, die ‘undogmatisches’ Annotieren erlauben – also Tools, die beispielsweise mehrere Annotationsmodi anbieten (tagset-/taxonomiebasiert und freie Kommentare), die freie Tagseterstellung erlauben (siehe auch Ontologieentwicklung) und überlappende bzw. widersprüchliche Annotationen zulassen. Ein solches Tool ist zum Beispiel CATMA (siehe auch die Lerneinheiten Annotation mit CATMA und Analyse und Visualisierung mit CATMA sowie die Video-Tutorial-Reihe Annotation und Literaturanalyse).

Texte lesen und untersuchen: Für die Annotation von Manuskripten und die digitale Manuskriptanalyse eignet sich beispielsweise das Tool Transkribus. Für die manuelle Annotation eignen sich beispielsweise Tools wie WebAnno, INCEpTION und CATMA (siehe auch die Lerneinheit Annotation mit CATMA und die Video-Tutorial-Reihe Annotation und Literaturanalyse). Schauen Sie sich hierzu auch unseren Beitrag Ontologieentwicklung an. Visualisierung kann Ihnen helfen, Ihre Annotationsdaten zu erkunden. Dafür eignen sich beispielsweise Tools wie StereoscopeVis-À-Vis oder CATMA (siehe auch die Lerneinheiten Analysieren und Visualisieren mit CATMA und Visualisierung mit CATMA und Stereoscope).

Eine spezielle Form der Visualisierung, mit der Sie Ihre Annotationsdaten analysieren können, ist die Netzwerkanalyse. Hierfür eignen sich beispielsweise Tools wie ezlinavis und Gephi (siehe auch die Lerneinheit Netzwerkanalyse mit Gephi, die Video-Tutorial-Reihe Netzwerkanalyse und Literaturanalyse und die Video-Fallstudie Analyse der Figurennetzwerke in Lessings Emilia Galotti). Dieses Verfahren ist besonders gut und mit wenig Aufwand für die Analyse von Dramen geeignet. Direkten Zugriff auf dramatische Texte erhalten Sie übrigens in DraCor – hier können Sie direkt Netzwerkvisualisierungen mit den ausgewählten Texten erstellen.

Für die digitale Gedichtanalyse, insbesondere die Analyse von Klangstrukturen in (englischsprachigen) Gedichten, kann das Tool Poemage genutzt werden.

Eigene Routinen entwickeln: Wie Sie selbst Routinen zur automatischen Texterkundung entwickeln können, erfahren Sie in unserem Methodeneintrag Maschinelles Lernen. Ein einsteigerfreundliches Tool für das Trainieren eigener Modelle zur automatischen Annotation ist INCEpTION. Bei der Einarbeitung hilft Ihnen unsere Lerneinheit Maschinelles Lernen mit INCEpTION. Erwähnung findet das Thema des maschinellen Lernens darüber hinaus auch in den Methodenbeiträgen Named Entity Recognition und Sentimentanalyse, im Tooleintrag Stanford Named Entity Recognizer, in der Lerneinheit Named Entity Recognition sowie in der Video-Tutorial-Reihe Named Entity Recognition und Literaturanalyse.

Klassische Hermeneutik: Wenn Sie hermeneutisch arbeiten, ist CATMA für die manuelle Annotation und Analyse Ihrer Texte besonders geeignet für Sie, da es in seinem flexiblen Workflow zwischen Entwicklung des Interpretationsinstrumentariums, Annotation, Analyse und Visualisierung den hermeneutischen Zirkel abbildet.

Strukturalismus: Wenn Sie mit manueller Annotation arbeiten möchten, könnte für Sie möglicherweise unser Tagset Strukturalismus nützlich sein.

Poststrukturalismus/Dekonstruktion: Wenn Sie Ihre Texte dekonstruktivistisch analysieren möchten, könnte für Sie im Rahmen einer manuellen Annotation das Tagset Dekonstruktion interessant sein.

Diskursanalyse: Für diskursanalytische Untersuchungen könnten Sie im Rahmen einer manuellen Annotation Ihres Textes unser Tagset Diskursanalyse nutzen.

Oben genannte Tagsets können beispielsweise in CATMA verwendet werden.

Für die Untersuchung narrativer Elemente können Sie im Rahmen manueller Annotation unsere Tagsets Narratologie (discours) und Narratologie (histoire) nutzen, die beispielsweise in CATMA verwendet werden können.

Intertextuelle Verweise lassen sich mithilfe unseres Tagsets Intertextualität, das beispielsweise in CATMA verwendet werden kann, manuell annotieren. Zudem ist auch die Netzwerkanalyse eine sinnvolle Methode zur Untersuchung intertextueller Bezüge.

Für intermediale Analysen können Sie unser Tagset Intermedialität, das beispielsweise in CATMA verwendet werden kann, für die manuelle Annotation Ihrer Texte nutzen.

Wenn Sie Gender-Thematiken in Ihren Texten untersuchen möchten, können Sie hierfür im Rahmen manueller Annotation unser Tagset Genderstudies, das beispielsweise in CATMA verwendet werden kann, nutzen.

Linguistische Eigenschaften: Tools, mit denen Sie Texte automatisch anhand linguistischer Kategorien auszeichnen lassen können, sind beispielsweise WebLicht und WebAnno. Ergänzende Informationen über einzelne analysierte Wörter können Sie im DWDS erhalten. Sie können außerdem prüfen, ob Ihre Texte im DTA verfügbar sind – dort sind die Texte bereits mit zahlreichen Metadaten versehen.

Worthäufigkeiten, -verteilungen und -kontexte können Sie beispielsweise mit Tools wie Voyant oder CATMA (siehe auch die Lerneinheiten Visualisierung mit Voyant, Analyse und Visualisierung mit CATMA und Visualisierung mit CATMA und Stereoscope sowie die Video-Tutorial-Reihen Visualisierung und Literaturanalyse und Annotation und Literaturanalyse). Eine komplexe Methode der Erkundung von semantischen Wortkontexten ist Word2Vec. Sie ist allerdings nur bei sehr großen Textmengen nutzbar.

Figuren, Orte u.a. Entitäten: Named Entity Recognition ist eine digitale Methode zur automatischen Erkennung und Auszeichnung benannter Entitäten wie Figuren, Orten oder Organisationen. Ein geeignetes Tool ist beispielsweise der Stanford Named Entity Recognizer (siehe auch die Lerneinheit Named Entity Recognition mit dem Stanford Named Entity Recognizer, die Video-Tutorial-Reihe Named Entity Recognition und Literaturanalyse und die Video-Fallstudie Konstellationen bei Goethe und Plenzdorf).

Beziehungen und Netzwerke zwischen Entitäten: Die digitale Netzwerkanalyse liefert unterschiedliche Möglichkeiten zur Erkundung der Konstellationen zwischen Figuren, Konzepten oder anderen Entitäten. Geeignete Tools sind beispielsweise ezlinavis oder Gephi (siehe auch die Lerneinheit Netzwerkanalyse mit Gephi, die Video-Tutorial-Reihe Netzwerkanalyse und Literaturanalyse und die Video-Fallstudie Analyse der Figurenetzwerke in Lessings Emilia Galotti).

Dieses Verfahren ist besonders gut und mit wenig Aufwand für die Analyse von Dramen geeignet. Direkten Zugriff auf dramatische Texte erhalten Sie übrigens in DraCor – hier können Sie direkt Netzwerkvisualisierungen mit den ausgewählten Texten erstellen.

Stilistisches: Eine digitale Methode für die statistikbasierte Stilanalyse ist die Stilometrie. Stilometrische Untersuchungen lassen sich beispielsweise mit dem Tool Stylo durchführen (siehe auch die Lerneinheit Stilometrie mit Stylo, die Video-Tutorial-Reihe Stilometrie und Literaturanalyse und die Video-Fallstudie Literarische Stilanalyse von Christoph Martin Wieland und Sophie von la Roche).

Themen: Für die statistikbasierte Erforschung von Themen in Texten eignet sich die digitale Methode des Topic Modeling. Hierfür können Sie beispielsweise den DARIAH Topics Explorer nutzen (siehe auch die Lerneinheit Topic Modeling mit dem DARIAH Topics Explorer, die Video-Tutorial-Reihe Topic Modeling und Literaturanalyse und die Video-Fallstudie Literatur des 19. Jahrhunderts analysiert). Topic Modeling ist nur bei größeren Textmengen (ab zehn Texten) sinnvoll nutzbar.

Emotionale Dimensionen: Mithilfe der Sentimentanalyse können emotionale Dimensionen von Texten erkundet werden. Hierfür eignen sich zum Beispiel Tools wie LIWC. In die Nutzung des Tools können Sie sich mithilfe der Lerneinheit Sentimentanalyse einarbeiten.

Ja: Von den weiter oben teilweise vorgeschlagenen Tools unterstützen Transkribus, CATMA und WebAnno kollaboratives Arbeiten.

Die Besonderheiten gemeinschaftlchen Annotierens sind in unserem Methodenbeitrag Kollaborative Annotation beschrieben.

Ja: Von den weiter oben vorgeschlagenen Tools unterstützt leider keines kollaboratives Arbeiten. Behelfen könnten Sie sich möglicherweise damit, die Exportfunktion solcher Tools zu nutzen, um Ihre Daten extern zu speichern und an Ihre Kolleg*innen weiterzugeben. Diese können die Daten dann bei Bedarf wieder in das Tool importieren und daran weiterarbeiten. Solch eine Behelfsmethode erfordert allerdings eine sorgfältige Dokumentation der unterschiedlichen Versionen Ihrer Arbeitsdaten sowie intensive Kommunikation zwischen den Teammitgliedern.

Diachrones Korpus: Wie Sie auch in unserem Methodeneintrag Korpusbildung erfahren können, ist insbesondere bei der automatisierten Analyse diachroner Textsammlungen zu beachten, dass sich Schreibweisen desselben Wortes unterscheiden können. Hierdurch können Analyseergebnisse möglicherweise verfälscht werden. In manchen digitalen Textsammlungen, beispielsweise im DTA, finden Sie immer standardisierte Fassungen der Texte. Wenn Sie digitale Texte aus anderen Quellen beziehen, könnte es empfehlenswert sein, Ihre Texte in einem vorbereitenden Schritt teilautomatisiert auszuzeichnen, um gleiche Wörter in unterschiedlicher Schreibweise als zusammengehörig zu markieren. Dies ist beispielsweise mit dem Tool CATMA möglich (siehe auch die Lerneinheiten Annotation mit CATMA und Analyse und Visualisierung mit CATMA sowie die Video-Tutorial-Reihe Annotation und Literaturanalyse).

Ja: Da in der Ersten Orthographischen Konferenz von 1876 erstmals eine einheitliche Rechtschreibung für die deutsche Sprache festgelegt wurde, kann in Texten, die aus dem Zeitraum vor diesem Datum stammen, die Schreibweise desselben Wortes variieren (vgl. Methodeneintrag Korpusbildung). Hierdurch können Analyseergebnisse möglicherweise verfälscht werden. In manchen digitalen Textsammlungen, beispielsweise im DTA, finden Sie immer standardisierte Fassungen der Texte. Wenn Sie digitale Texte aus anderen Quellen beziehen, könnte es empfehlenswert sein, Ihre Texte in einem vorbereitenden Schritt teilautomatisiert auszuzeichnen, um gleiche Wörter in unterschiedlicher Schreibweise als zusammengehörig zu markieren. Dies ist beispielsweise mit dem Tool CATMA möglich(siehe auch die Lerneinheiten Annotation mit CATMA und Analyse und Visualisierung mit CATMA sowie die Video-Tutorial-Reihe Annotation und Literaturanalyse).

B. Lehre

Texte mithilfe von Visualisierung explorieren: Visualisierung als digitale Methode kann helfen, Texte zu erkunden. Wie Sie Ihre Studierenden an diese Methode heranführen können, ist in unserem Lehrmodul Visualisierung mit CATMA und Stereoscope beschrieben (siehe auch die Lerneinheiten Textvisualisierung mit Voyant, Analyse und Visualisierung mit CATMA und Visualisierung mit CATMA und Stereoscope sowie die Video-Tutorial-Reihe Visualisierung und Literaturanalyse).

Texte mit Analysekategorien versehen und auswerten: Eine einsteigerfreundliche Textauszeichnung sowie eine Analyse von Text und Auszeichnungen ermöglicht zum Beispiel das Tool CATMA. Wie Sie dieses in der universitären Lehre einsetzen können, erfahren Sie in unserem Lehrmodul CATMA (siehe auch die Lerneinheiten Annotation mit CATMA, Analyse und Visualisierung mit CATMA und Korpusanalyse mit CATMA, die Methodeneinträge Manuelle Annotation, Kollaborative Annotation und Ontologieentwicklung sowie die Video-Tutorial-Reihe Annotation und Literaturanalyse).

Figuren und Orte markieren: Die digitale Methode der Named Entity Recognition hat die automatische Markierung konkreter Entitäten wie Figuren und Orte zum Gegenstand. Als Tool ist der Stanford Named Entity Recognizer zu empfehlen. Das Lehrmodul Named Entity Recognition mit dem Stanford Named Entity Recognizer enthält didaktisches Material für den Einsatz dieser Methode in der universitären Lehre (siehe auch die Lerneinheit Named Entity Recognition, die Video-Tutorial-Reihe Named Entity Recognition und Literaturanalyse und die Video-Fallstudie Konstellationen bei Goethe und Plenzdorf).

Figurenkonstellationen untersuchen: Die Netzwerkanalyse ist eine digitale Methode zur Untersuchung von Figurenkonstellationen in Texten. Als Tool ist beispielsweise Gephi geeignet. Das Lehrmodul Netzwerkanalyse mit Gephi liefert Anregungen für den Einsatz der Methode in universitären Lehrveranstaltungen (siehe auch die Lerneinheit Netzwerkanalyse, die Video-Tutorial-Reihe Netzwerkanalyse und Literaturanalyse und die Video-Fallstudie Analyse der Figurennetzwerke in Lessings Emilia Galotti).

Texte thematisch explorieren: Für die thematische Exploration von Texten auf statistischer Basis eignet sich die digitale Methode des Topic Modeling. Als Tool ist beispielsweise der DARIAH Topics Explorer geeignet. Das Lehrmodul Topic Modeling mit dem Topics Explorer kann helfen, die Methode Studierenden nahezubringen (siehe auch die Lerneinheit Topic Modeling, die Video-Tutorial-Reihe Topic Modeling und Literaturanalyse und die Video-Fallstudie Literatur des 19. Jahrhunderts analysiert).

Texte stilistisch vergleichen: Für einen auf statistischer Basis erzeugten stilistischen Vergleich literarischer Texte eignet sich die digitale Methode der Stilometrie. Als Tool ist beispielsweise Stylo geeignet. Ideen für Einsatzmöglichkeiten in der universitären Lehre finden sich in unserem Lehrmodul Stilometrie mit Stylo (siehe auch die Lerneinheit Stilometrie, die Video-Tutorial-Reihe Stilometrie und Literaturanalyse und die Video-Fallstudie Literarische Stilanalyse von Christoph Martin Wieland und Sophie von la Roche).

Texte explorieren und visualisieren: Für eine einsteigerfreundliche Textexploration und -visualisierung eignen sich beispielsweise die Tools CATMA und Voyant. Möglichkeiten des Einsatzes dieser Tools im Schulunterricht beschreiben unsere Routineneinträge Textanalyse mit CATMA unterrichten und Textvisualisierung mit Voyant unterrichten (siehe auch die Lerneinheiten Analyse und Visualisierung mit CATMA, Visualisierung mit CATMA und Stereoscope und Visualisierung mit Voyant, die Video-Tutorial-Reihen Visualisierung und Literaturanalyse und Annotation und Literaturanalyse sowie den Methodeneintrag Visualisierung).

Texte mit Analysekategorien versehen und auswerten: Eine einsteigerfreundliche Textauszeichnung sowie eine Analyse von Text und Auszeichnungen ermöglicht zum Beispiel das Tool CATMA. Wie Sie dieses im Schulunterricht einsetzen können, erfahren Sie in unserem Routineneintrag Textanalyse mit CATMA unterrichten (siehe auch die Lerneinheit Annotation mit CATMA, die Methodeneinträge Manuelle Annotation, Kollaborative Annotation und Ontologieentwicklung sowie die Video-Tutorial-Reihe Annotation und Literaturanalyse).

Figurenkonstellationen untersuchen: Geeignet für eine einsteigerfreundliche Analyse von Figurenkonstellationen ist beispielsweise das Tool ezlinavis. Die Einsatzmöglichkeiten des Tools im Schulunterricht sind in unserem Routineneintrag Netzwerkanalyse mit ezlinavis unterrichten beschrieben (siehe auch die Lerneinheit Netzwerkanalyse, die Video-Tutorial-Reihe Netzwerkanalyse und Literaturanalyse und den Methodeneintrag Netzwerkanalyse).

Vielen Dank, dass Sie den forTEXT-Projektpiloten verwendet haben. Wir hoffen, dass unsere Vorschläge Ihnen weiterhelfen.

Sie haben die Möglichkeit, Ihre Ergebnisse zu drucken:
Druckdialog aufrufen

Wenn Sie mithelfen möchten, den Projektpiloten zu optimieren, können Sie uns Ihre Ergebnisse übermitteln, indem Sie unten auf Absenden klicken.

Wir freuen uns, wenn Sie vor dem Absenden Ihre Erfahrung mit dem Projektpiloten bewerten.
Wenn Sie Ihre E-Mail-Adresse eingeben, werden Ihnen die Ergebnisse des Projektpiloten in elektronischer Form zugesandt. Ihre Mailadresse wird weder zu anderen Zwecken genutzt noch an Dritte weitergegeben. Bei Interesse lesen Sie unsere Datenschutzerklärung.

Falls Sie Vorschläge für eines Ihrer anderen Projekte erhalten oder Ihre Antworten anpassen möchten, können Sie den Fragebogen erneut ausfüllen.