Im Bereich Tools bieten wir Ihnen eine kommentierte Liste digitaler Werkzeug-Suites bzw. Funktionskomponenten, mithilfe derer unterschiedliche Operationen der digitalen Textarbeit durchgeführt oder unterstützt werden können. Darüber hinaus werden wir auch eigene Funktionskomponenten entwickeln. Hierzu gehört vornehmlich die Weiterentwicklung des Textannotations- und Analyseprogramms CATMA. Wir möchten somit technisch weniger versierten geisteswissenschaftlichen Nutzer*innen ermöglichen, hochfunktionale Tools einzusetzen, ohne sich umfangreich einarbeiten zu müssen.
Abbyy FineReader
Der Abbyy FineReader ist eine kommerzielle OCR-Software, die sehr zuverlässig läuft und gute Resultate erzielt. Der Digitalisierungsprozess, der dem digitalen geisteswissenschaftlichen Forschungsprozess häufig vorausgeht, wird dadurch effizienter.
CATMA
CATMA (Computer Assisted Text Markup and Analysis) ist ein im Browser laufendes Tool, das die manuelle Annotation und Analyse von Texten digital unterstützt und dabei den traditionellen philologischen Workflow zum Vorbild hat. Das webbasierte Tool braucht nicht auf dem eigenen Rechner installiert zu werden, ist sehr performant und zuverlässig.
Citavi
Citavi ist ein Literaturverwaltungsprogramm für Windows. Mit Citavi können Referenzen zu Fachliteratur gesammelt, um Notizen angereichert und in Form von Einzelverweisen und ganzen Bibliografien exportiert werden. Citavi eignet sich außerdem zur Literaturrecherche und zur Wissensorganisation.
CorpusExplorer
Der CorpusExplorer ist ein computerlinguistisches Tool zur Aufbereitung und Analyse von Korpora. Es kann zur explorativen Erforschung von Texten in digitaler Form genutzt werden und bietet eine Vielzahl an Auswertungsfunktionen.
DARIAH Topics Explorer
Mit dem DARIAH Topics Explorer kann Topic Modeling ohne Vorkenntnisse über eine grafische Nutzeroberfläche durchgeführt werden. Fragestellungen nach Themenfeldern in Textsammlungen, wie z. B. „Welche Themen kommen in Goethes Prosawerken gehäuft vor und wie verteilen sie sich über die einzelnen Texte?", können damit untersucht werden.
DHVLab
Das DHVLab dient als virtuelle Lehr- und Forschungsinfrastruktur zur Kompetenzvermittlung von Methoden der Digital Humanities an Studierende der Kunst-, Geschichts- und Sprachwissenschaften. Auf der Startseite sind sämtliche Module (virtueller Desktop, Datenrepositorium, Dokumentations-/ Publikationsumgebung, Lehr-/ Lernumgebung) zu finden. Ziel ist die Vermittlung von allgemeinen IT-Kenntnissen, speziellen Kenntnissen in Informatik und Statistik sowie der Umgang mit großen digitalen Datensammlungen. Das DHVLab ist ein komplexes System mit mehreren Modulen, dessen Nutzung von den User*innen dynamisch angepasst werden kann.
Ezlinavis
Easy Linavis oder auch Ezlinavis ist ein Tool zur Produktion von ungerichteten Netzwerken. Das intuitiv bedienbare Tool führt durch die beinahe selbsterklärende Handhabung äußerst niedrigschwellig an die digitale Netzwerkerstellung heran. Es ist auf die elementaren Schritte der Netzwerkerstellung limitiert und liefert unmittelbar vorzeigbare Ergebnisse.
Gensim
Gensim ist eine Open-Source-Bibliothek für Python, die verschiedene Algorithmen beinhaltet. Gensim kann für unterschiedliche Fragestellungen eingesetzt werden. Da alle Algorithmen ermöglichen, automatisiert semantische Strukturen in den Textdaten zu entdecken, bietet Gensim sich insbesondere für die Verarbeitung großer Textsammlungen an.
Gephi
Gephi dient zur Visualisierung von Netzwerken und kann darum besonders gut bei Fragestellungen nach netzwerkartigen Konstellationen und Strukturen eingesetzt werden.
GROBID
GROBID ist ein Open Source Tools welches rohe TXT- und PDF-Dateien strukturieren und in TEI/XML umwandeln kann. Mit diesem Tool können bibliographische Informationen aus Texten extrahiert oder ganze Texte in TEI konvertiert werden.
INCEpTION
INCEpTION ist ein im Browser laufendes Tool zur manuellen und automatischen Annotation von großen Textsammlungen. Ferner unterstützt es kollaboratives Arbeiten an Texten und bietet das automatische Berechnen einer Übereinstimmung zwischen Annotator*innen (inter-annotator agreement) an.
LIWC
LIWC (Linguistic Inquiry and Word Count) ist ein Tool zur computergestützten quantitativen Textanalyse, das die Sentimentanalyse eigener Texte ermöglicht. Mittels lexikonbasierter Sentimentanalyse werden Texte statistisch ausgewertet: Das Tool bestimmt Worthäufigkeiten und berechnet u. a. die prozentuale Vorkommenshäufigkeit der Lexeme mit emotionaler und kognitiver Signalwirkung, indem es sie unterschiedlichen Kategorien zuordnet.
Lyra
Lyra ist eine interaktive Umgebung, die es ermöglicht, Visualisierungen von Daten individuell zu erstellen. Hierzu muss nicht programmiert werden, denn die Visualisierungen werden bequem per Drag-and-Drop (der Daten zu den gewünschten Positionen) erzeugt.
OCR4all
OCR4all ist ein kostenfreies, sehr zuverlässiges Texterkennungstool, das gute Resultate erzielt. Mit OCR4all können insbesondere Scans von Texten in Fraktur- und Antiquasschriften aus dem 19. Jahrhundert automatisch und ältere Texte bis hin zum 15. Jahrhundert semi-automatisch in computerlesbare Textdokumente umgewandelt werden. Der Digitalisierungsprozess älterer Drucke wird damit einfacher, schneller und effizienter.
Poemage
Mit Poemage lassen sich klangliche Strukturen von Gedichten mit visueller Unterstützung untersuchen. Die phonetische Analyse funktioniert bei Poemage auf Basis textsprachlicher Informationen und kann damit auf jedes Gedicht angewendet werden – bislang jedoch nur in englischer Sprache. Durch die visuelle Exploration klanglicher Strukturen können phonetische Muster und Zusammenhänge in Gedichten im Zuge eines Close Readings entdeckt und untersucht werden.
Prezi
Mit der Präsentationssoftware Prezi können bei Vorträgen Sinnzusammenhänge und Ideen visualisiert werden. Nutzer*innen konzipieren mithilfe des Tools eine Kamerafahrt durch eine virtuelle Sammlung von Inhalten. Das Tool begünstigt ein dialogorientiertes Präsentieren: Im Vordergrund einer Prezi-Präsentation stehen Visualisierungen aller Art und die Redner*innen selbst.
Protégé
Protégé ist ein Tool für die Erstellung komplexer Ontologien, d. h. es können Kategorien für die Beschreibung eines (beispielsweise literarischen) Gegenstandsbereichs festgelegt, untereinander verknüpft und ausführlich beschrieben werden. Das Tool unterstützt die wissenschaftliche Modell- bzw. Theoriebildung.
SentText
SentText ist ein Tool zur literaturwissenschaftlichen lexikonbasierten Sentimentanalyse deutschsprachiger Texte. Das dem Forschungsfeld des Text Mining zugehörige Tool erkennt Sentiment-tragende Wörter (sog. sentiment bearing words) in literarischen Texten, berechnet pro Wort, Text oder Textsammlung den durchschnittlichen Sentimentwert und generiert diverse Visualisierungen der Analyseergebnisse. Nutzer*innen können die Sentimentanalyse der von ihnen ausgewählten Texte durch unterschiedliche Möglichkeiten der Feinjustierung aktiv mitgestalten und auf den jeweiligen Untersuchungsgegenstand ausrichten.
Stanford Named Entity Recognizer
Mit Stanford-NER können vor allem Fragen nach quantitativen Aspekten von Figurennamen, Orten und Organisationen bearbeitet werden, wie etwa: Wie viele Figuren werden in einem Text benannt, und welche Figuren werden am häufigsten erwähnt? Was für Orte kommen vor, und wie ist die Verteilung von Ortsnennungen? Oder zum Beispiel: In welchem Kontext werden Organisationen genannt?
Stereoscope
Stereoscope ist ein webbasierter Prototyp zur Visualisierung von hermeneutischen Prozessen und Argumentationen in den Literaturwissenschaften. Literaturwissenschaftler*innen können ihre manuell erstellten digitalen Annotationen in Gestalt von verschiedenen Visualisierungen repräsentieren und so qualitative Aussagen über die Annotationen visuell festhalten und vermitteln.
Stylo
Mit Stylo lassen sich alle Fragen der Stilometrie bearbeiten. Dazu gehören vor allem Fragen der Autorschaftsattribution, Genre- oder Epochenklassifikationen, stilistische Entwicklungen eines Autorinnenoeuvres usw. Das Tool ermöglicht dabei die Anwendung unterschiedlicher in der Stilometrie diskutierter Algorithmen.
tagtog
tagtog ist ein englischsprachiges Tool zur Annotation von Textdaten, das die Möglichkeit bietet, auf Grundlage manueller Annotationen, ein projektspezifisches Machine-Learning durchzuführen, einen bereits vorhandenen ML-Algorithmus ins Projekt einzubinden, oder den tooleigenen ML-Classifier zur automatisierten Annotation zu nutzen. Das Tool steht in verschiedenen, teilweise kostenpflichtigen, Versionen zur Verfügung. Je nach Version ist das Tool daher cloudbasiert über ein Webinterface zu erreichen oder lokal verwendbar.
Transkribus
Das Kerngeschäft von Transkribus ist die Digitalisierung von Handschriften, d. h. das manuelle Transkribieren und die automatisierte Handschriftenerkennung (HTR). Zusätzlich wird auch eine optische Zeichenerkennung (OCR) für Druckschriften angeboten. Editionswissenschaftliche Projekte können in Transkribus ausgeführt werden, die Digitalisierung kann aber auch als Vorbereitung für eine Weiterverarbeitung der Texte mit anderen digitalen Tools dienen.
Trello
Trello ist ein Tool zur digitalen Projektkonzeption. Das Tool ist auch kollaborativ nutzbar und ermöglicht das Erstellen von multifunktionalen Pinnwänden, die v. a. der Organisation und Koordination von Projekten dienen.
Voyant
Voyant bündelt eine Vielzahl unterschiedlicher Tools, die sich für die digitale Textanalyse einzelner Texte oder ganzer Textsammlungen einsetzten lassen. Die Analyseergebnisse werden in facettenreichen Darstellungsformen visualisiert. Die übersichtlich gestaltete wie einfach bedienbare Benutzeroberfläche macht Voyant zu einem besonders einsteigerfreundlichen Tool.
WebAnno
Mit WebAnno können vor allem Fragestellungen bearbeitet werden, die sich auf klar definierte Einheiten von Texten beziehen. Dazu gehören Fragen wie: Welche Funktionen haben Ortsnennungen in literarischen Texten? Wo finden sich intertextuelle Bezüge von ausgewählten Autoren des 20. Jahrhunderts auf die Philosophie Nietzsches? Aber auch Fragen, die sich auf literaturwissenschaftliche Methoden als solche beziehen, können mit WebAnno bearbeitet werden. Ein Beispiel dafür wäre: Wie unterscheiden sich Interpretationen der narratologischen Kategorie „Zeit”, die von drei voneinander unabhängig arbeitenden Literaturwissenschaftler*innen erarbeitet werden?
WebLicht
WebLicht ist eine webbasierte Toolsuite, die von CLARIN-D bereitgestellt wird. Mit WebLicht können eine Reihe von Methoden zur Vorbereitung der digitalen Textanalyse durchgeführt werden. Die Tools können in vorbereiteten Pipelines genutzt (Easy Mode) oder frei kombiniert werden (Advanced Mode).
Zotero
Zotero ist ein Open-Source-Literaturverwaltungsprogramm, mit dem Sie Fachliteratur sammeln, organisieren, bearbeiten und zitieren können. Das multifunktionale Tool fungiert v. a. als individuell wie kollaborativ geführte digitale Fachbibliografie.