Textsammlungen

Um digital mit Texten arbeiten zu können, ist es unerlässlich, die Texte digitalisiert vorliegen zu haben. Da es sehr mühselig sein kann, die zu erforschenden Texte selbst zu scannen und unter Zuhilfenahme von Texterkennungsprogrammen zu digitalisieren (OCR = optical character recognition), lohnt sich ein Blick in bereits existierende digitale Textkorpora. Häufig sind diese Textkorpora bereits mit reichlich Metadaten und Markup versehen.

Auf dieser Seite sammeln wir für Sie digitale Textsammlungen für deutschsprachige Literatur.

KOLIMO: Korpus der literarischen Moderne

4. Februar 2019
KOLIMO Korpus der literarischen Moderne: DTA, Textgrid, Gutenberg

Das KOLIMO (Korpus der literarischen Moderne) versammelt deutschsprachige narrative, fiktionale Erzähltexte der literarischen Moderne aus den Textsammlungen Deutsches Textarchiv, TextGrid Repository und Gutenberg, vereinheitlicht die bestehenden Metadaten und fügt weitere hinzu, um epochenspezifische und aufgrund einheitlicher Daten verlässliche Abfrageergebnisse erhalten zu können.