Preprocessing mit NLTK
Eckdaten der Lerneinheit
- Anwendungsbezug: Textvorverarbeitung von Goethes “Die Leiden des jungen Werthers”
- Methodik: Korpusbildung und Preprocessing
- Angewendetes Tool: NLTK
- Lernziele: Einzelne Schritte zur Textbereinigung, wie z.B. Löschen von Leerzeilen, Entfernen von Stoppwörtern oder Tokenisierung auswählen und durchführen können
- Dauer der Lerneinheit: ca. 60 Minuten
- Schwierigkeitsgrad des Tools: mittel