INCEpTION

INCEpTION Interface und Workflow in drei Abbildungen
Der Workflow von INCEpTION: Über Settings im Dashboard-Menü können die zu annotierenden Dokumente hochgeladen werden. Im Menü des Bereichs Annotation wird der jeweilige Text annotiert. Nachdem dieser finalisiert wurde, kann er in einem beliebigen Format exportiert werden.

Systemanforderungen: Das Tool wird als installierbares Softwarepaket angeboten. Nutzer*innen müssen es auf dem eigenen Laptop, PC oder Server installieren.
Stand der Entwicklung: INCEpTION ist 2016 als von der DFG gefördertes Projekt gestartet.
Herausgeber: INCEpTION wird derzeit am Ubiquitous Knowledge Processing (UKP) Lab der Technischen Universität Darmstadt entwickelt.
Lizenz: Kostenfreie Open Source-Nutzung unter Apache 2.0 Lizenz
Weblink: https://inception-project.github.io/
Im- und Export: Import und Export in den Formaten CoNLL-Formate, TEI XML, Plain Text, UIMA, WebAnno.

1. Für welche Fragestellungen kann INCEpTION eingesetzt werden?

INCEpTION ist ein Tool zur manuellen und automatisierten Annotation und kann darum für eine Vielzahl literaturwissenschaftlicher Fragestellungen eingesetzt werden. Besonders geeignet ist es für Ansätze, bei denen vordefinierte und klar operationalisierte Kategorien genutzt werden. So kann das Tool während der manuellen Annotation lernen, welche Indikatoren im Text auf welche Weise markiert werden sollen und kann Vorschläge dafür generieren. Eine Fragestellung, die einen solchen Ansatz leiten könnte, wäre z.B. “Welche realweltlichen Orte werden in Erzähltexten des Realismus erwähnt und welche Städte und/oder Landschaften können als literarische Hotspots dieser Epoche ausgemacht werden?”.

2. Welche Funktionalitäten bietet INCEpTION und wie zuverlässig ist das Tool?

Funktionen:

  • Anlegen von Projekten, in denen die zu annotierenden Dokumente hochgeladen werden und eigene Annotationsschemata angelegt oder voreingestellte Kategorien genutzt werden können
  • Kollaboratives Annotieren inklusive Vergleich und Korrektur zwischen den Annotator*innen
  • Überlappende sowie Mehrfachannotation möglich
  • (Halb-) automatisches Annotieren auf Basis von Machine-Learning-Technologien
  • Abfragen (Inception nutzt dazu eine Corpus Query Language oder kurz CQL)

Zuverlässigkeit: Das Tool läuft sehr zuverlässig.

3. Ist INCEpTION für DH-Einsteiger*innen geeignet?

Checkliste √ / teilweise / –
Methodische Nähe zur traditionellen Literaturwissenschaft
Grafische Benutzeroberfläche
Intuitive Bedienbarkeit teilweise
Leichter Einstieg teilweise
Handbuch vorhanden
Handbuch aktuell
Tutorials vorhanden
Erklärung von Fachbegriffen teilweise
Gibt es eine gute Nutzerbetreuung?

INCEpTION ist ein Tool, das viele Funktionen zur Annotation bietet. Die Benutzeroberfläche ist in mehrere Module unterteilt. Für den Einstieg in die Bereiche Curation und Monitoring, sind grundlegende Kenntnisse der Konzepte nötig - das Einlesen in das Benutzerhandbuch wird hierfür empfohlen. Auch ist das Anlegen eines individuellen Tagsets sehr komplex und erfordert eine genauere Kenntnis des Tools.

Der Kontakt zu den Nutzer*innen ist dem INCEpTION-Team besonders wichtig und auf Anfragen wird in der Regel in kurzer Zeit reagiert. Nutzer*innen können für Support-Anfragen, Wünsche nach neuen Funktionen oder Meldungen von Fehlern Issues über GitHub einreichen. Sie können außerdem mittels Mailingliste oder Chat Fragen zum Tool stellen oder Feedback geben.

4. Wie etabliert ist INCEpTION in den (Literatur-)Wissenschaften?

INCEpTION ist ein noch vergleichsweise neues Tool, wurde aber bereits in einer Reihe wissenschaftlicher Projekte eingesetzt, die zum großen Teil einen linguistischen Schwerpunkt haben. Eine Übersicht über Projekte, die mit dem Tool arbeiten stellt INCEpTION auf der Webseite bereit. In den (digitalen) Literaturwissenschaften wird es z.B. im Text-Mining-Projekt MiMoText eingesetzt. In der methodenorientierten Auflistung und Beschreibung geisteswissenschaftlicher Tools "Digitale Werkzeuge zur textbasierten Annotation, Korpusanalyse und Netzwerkanalyse in den Geisteswissenschaften" (vgl. Frey-Endres et al. 2021) wird auch INCEpTION gelistet, in zwei im Jahr 2019 und 2021 durchgeführten quantitativ ausgerichteten Betrachtungen der Nutzung von Tools in der internationalen Digital-Humanities-Community findet INCEpTION keine Erwähnung (vgl. Barbot et al. 2019; Fischer et al. 2021).

5. Unterstützt INCEpTION kollaboratives Arbeiten?

Ja, es kann kollaborativ gearbeitet werden. Zudem bietet das Tool eine automatische Agreement-Berechnung an.

6. Sind meine Daten bei INCEpTION sicher?

Da die Nutzer*innen INCEpTION als Paket herunterladen, verbleiben projektbezogene Daten bei ihnen und werden nicht an das INCEpTION-Team gesendet. Manche Universitäten oder andere Institutionen betreiben eigene INCEpTION-Instanzen und bieten deren Nutzung als Service an. Nutzer*innen dieser Services sollten sich bei Fragen zur Sicherheit an die jeweiligen Betreiber wenden. INCEpTION bietet außerdem die Möglichkeit, Exporte der Annotationsprojekte durchzuführen um sie als Backup außerhalb der Anwendung zu sichern. INCEpTION kann autark ohne Internetanbindung betrieben werden und ermöglicht so eine Abschottung des Tools und der Daten gegen unbefugte Zugriffe.

Personenbezogene Daten:
Bei lokalen Installationen (z.B. auf dem eigenen PC) sind beim Erstellen eines Nutzungskontos ein Name (oder Pseudonym) und ein Passwort erforderlich, welche innerhalb der Anwendung gespeichert werden. Bei lokalen Installationen werden Benutzername und Passwort lediglich lokal gespeichert. Bei einer Serverinstallation werden sie auf dem Server gespeichert. Passwörter werden verschlüsselt abgelegt.
Betreiber*innen der INCEpTION-Instanz können zustimmen, anonyme Statistiken an das INCEpTION-Team zu übermitteln (z.B. die genutzte Version von INCEpTION, Betriebssystem, Anzahl von Benutzeraccounts). Das INCEpTION-Team verwendet diese Statistik, um die Verbreitung der Software und ihrer Versionen zu verfolgen sowie die Entwicklung zu verbessern. Es wird über die Art der erhobenen anonymen Daten bei Inbetriebnahme der Instanz informiert. Dem kann bei der Erhebung direkt oder zu einem beliebigen späteren Zeitpunkt widersprochen werden.

Urheberrechtlich geschützte Daten:
Texte werden innerhalb der Anwendung hochgeladen und in einem geschützten Login-Bereich verwaltet.

7. Nachweise und weiterführende Literatur

  • Barbot, Laure, Frank Fischer, Yoann Moranville und Ivan Pozdniakov (2019): „Which DH Tools Are Actually Used in Research?“ In: Weltliteratur. URL: https://weltliteratur.net/dh-tools-used-in-research/ [Zugriff: 5.4.2021].
  • Fischer, Frank, Manuel Burghardt, Jan Luhmann, Laure Barbot, Yoann Moranville und Alireza Zarei (2021): „Die Werkbänke der Digital Humanities: Zur Rolle von Tools und Software für die Forschungsarbeit“. In: vDHd2021: Experimente. DOI:10.5281/zenodo.4639228.
  • Frey-Endres, Marcel und Tobias Simon (2021): „Digitale Werkzeuge zur textbasierten Annotation, Korpusanalyse und Netzwerkanalyse in den Geisteswissenschaften“ In: Digital Philology | Working Papers in Digital Philology, Bd. 2. Darmstadt: TUprints.

Links: