Textsammlungen

Um digital mit Texten arbeiten zu können, ist es unerlässlich, die Texte digitalisiert vorliegen zu haben. Da es sehr mühselig sein kann, die zu erforschenden Texte selbst zu scannen und unter Zuhilfenahme von Texterkennungsprogrammen zu digitalisieren (OCR), lohnt sich ein Blick in bereits existierende digitale Textkorpora. Häufig sind diese Textkorpora bereits mit reichlich Metadaten und Markup versehen.

Auf dieser Seite sammeln wir für Sie digitale Textsammlungen für deutschsprachige Literatur.

Bibliotheca Augustana

29. April 2019
Die Bibliotheca Augustana: Eine seit 20 Jahren bestehende digitale Textsammlung

Die Bibliotheca Augustana ist eine frei verfügbare Online-Volltextdatenbank, die v. a. Primärtexte diverser Fachgebiete versammelt. Vertreten sind: Allgemeine und vergleichende Sprach- und Literaturwissenschaft, Anglistik, Amerikanistik, Germanistik, Niederländische Philologie, Skandinavistik, Klassische Philologie, Romanistik und Slavistik.

DraCor: Drama Corpora Project

24. Juni 2019
DraCor: Drama Corpora Project Netzwerk Kopräsenz

DraCor bietet für eine Vielzahl von deutschsprachigen, russischen, spanischen, altgriechischen oder auch für Shakespeare-Dramen den zielgenauen Zugriff auf bestimmte Textuntermengen (wie etwa der gesprochene Text pro Figur; nur der Nebentext, nur Texte weiblicher Figuren etc.). DraCor generiert zudem automatisch Netzwerke, die figürliche Kopräsenzen anzeigen.

DROC: Deutsches Romankorpus

19. August 2019
DROC: Deutsches Romankorpus, NER, annotiert, direkte Rede, Koreferenzen

Das Deutsche Romankorpus (DROC) versammelt 90 annotierte Fragmente deutschsprachiger Romane (jeweils ca. 200 Sätze) vom 17. bis 20. Jahrhundert. Es enthält neben automatisch generiertem Markup zu Kapiteln, Segmenten, Dependenz- und Morphologieinformationen, Wortarten (POS), Sätzen und Absätzen auch über 50.000 manuell erstellte Annotationen zu benannten Entitäten, Koreferenzen, direkter Rede, sowie Sprechern und Adressaten dieser direkten Rede.

DWDS: Digitales Wörterbuch der Deutschen Sprache

1. Juli 2019
DWDS Digitales Wörterbuch der Deutschen Sprache

Das DWDS ist ein digitales Lexikon, das Ihnen die freie Suche nach Begriffen der deutschen Sprache und ihrer historischen und gegenwärtigen Bedeutung ermöglicht. Sie können bestimmen, in welchen der großen Textsammlungen (z. B. DWDS-Kernkorpora des 19., 20. oder 21. Jahrhunderts, Zeitungs-, Blog-, Webkorpora etc.) und welcher Textsorte (Belletristik, Wissenschaft, Gebrauchsliteratur oder Zeitungen) gesucht werden soll.

Germanistik im Netz

27. Mai 2019
Germanistik im Netz: Hilfreiche Ressource für Literaturwissenschaftler*innen

Germanistik im Netz (GiN) ist das Fachportal des seit Juli 2008 bestehenden Fachinformationsdienst (FID) Germanistik. Das Portal ermöglicht die wissenschaftliche Online-Recherche nach literatur- und sprachwissenschaftlicher Forschungsliteratur sowie nach Fachinformationen. Es fungiert als wichtiges Nachweisinstrument und zentraler Zugangspunkt zu einer Vielzahl relevanter Datenbanken, richtet sich an Studierende, Lehrende sowie Forschende und bildet die Schlüsselstelle für sämtliche Belange der philologischen Praxis (Publizieren, Partizipieren, Recherchieren, Forschen).

Katharsis

2. September 2019
Katharsis: Ressource und Tool für quantitative Dramenanalyse und Sentimentanalyse.

Katharsis ermöglicht die quantitative Dramenanalyse zahlreicher deutscher Dramen und die Sentimentanalyse ausgewählter Werke Gotthold Ephraim Lessings. Die literarische Gattung des Dramas zeichnet sich durch gut quantifizierbare Elemente wie ein abgeschlossenes Figureninventar und eine wiederkehrende Akt-Szenen-Struktur aus, die in der Ressource analysiert und visualisiert werden.

KOLIMO: Korpus der literarischen Moderne

4. Februar 2019
KOLIMO Korpus der literarischen Moderne: DTA, Textgrid, Gutenberg

Das KOLIMO (Korpus der literarischen Moderne) versammelt deutschsprachige narrative, fiktionale Erzähltexte der literarischen Moderne aus den Textsammlungen Deutsches Textarchiv, TextGrid Repository und Gutenberg, vereinheitlicht die bestehenden Metadaten und fügt weitere hinzu, um epochenspezifische und aufgrund einheitlicher Daten verlässliche Abfrageergebnisse erhalten zu können.

Lyrikline

29. Juli 2019
Lyrikline listen to the poet Startseite

Lyrikline ist eine multimodale, mehrsprachige Plattform für Lyrik. Die Gedichte werden frei online zugänglich gemacht, mit einem Bild der Autor*innen kombiniert und können zudem von diesen vorgelesen angehört werden. Die übersichtlich gestaltete Webseite ermöglicht u. a. eine gezielte und schnelle Suche nach Kategorien, Autor*innen oder Gedichten und die automatische Auswahl eines Zufallsgedichts.