Cross Validation

Die Cross Validation (deutsch Kreuzvalidierung) ist ein Testverfahren für Machine-Learning-Algorithmen. Dabei wird der Datensatz, statt einmalig in Trainings- und Testset, k-fach geteilt. Bei einer 5-fold-Cross-Validation wird der Datensatz demnach 5x geteilt, wobei die Teilung schematisch nach Index und nicht per Zufall erfolgt. In der ersten Iteration werden die ersten 1/k % der Daten als Trainingsdatensatz verwendet, bei der zweiten Iteration die nächsten 1/k % der Daten usw. Somit kann beispielsweise Overfitting bei kleinen oder unausgeglichenen Datensätzen entgegengewirkt werden.