Ressourcen

Repositorien
Um digital mit Texten arbeiten zu können, ist es unerlässlich, die Texte digitalisiert vorliegen zu haben. Da es sehr mühselig sein kann, die zu erforschenden Texte selbst zu scannen und unter Zuhilfenahme von Texterkennungsprogrammen zu digitalisieren (OCR = optical character recognition), lohnt sich ein Blick in bereits existierende digitale Textkorpora. Häufig sind diese Textkorpora bereits mit reichlich Metadaten und Markup versehen.

Auf dieser Seite sammeln wir für Sie Repositorien für deutschsprachige Literatur.

Tagsets
Häufig werden in der Literaturwissenschaft ähnliche Phänomene an unterschiedlichen Texten untersucht. Das können z. B. strukturelle Merkmale wie „narrative Ebenen“ oder Themen und Motive wie „Landschaften“ oder auch „Entsagung“ sein.

Um diese Phänomene in digitalen Texten zu annotieren, empfiehlt sich die Erstellung von sogenannten Tagsets, also einer Sammlung von deskriptiven Bezeichnungen zur Annotation der entsprechenden Phänomene im Text.

An dieser Stelle stellen wir Ihnen veröffentlichte Tagsets und Guidelines zur Nutzung dieser Tagsets zur Verfügung.