Overfitting

Ziel eines Machine-Learning-Modells (bzw. Classifiers) ist es, auf Grundlage von erlernten Strukturen, neue, unbekannte Daten zu klassifizieren. Hat der Algorithmus während des Trainings allerdings den Datensatz "auswendig” gelernt, ist er so spezifisch auf diese Daten ausgelegt, dass er nicht mehr in der Lage ist, unbekannte Daten korrekt zu kategorisieren. Dieses Phänomen beschreibt man als Overfitting (deutsch: Überanpassung). Um dies zu vermeiden, werden Techniken wie die Kreuzvalidierung oder die k-fache Kreuzvalidierung angewendet.