Metriken der Klassifikation

Konfusionsmatrix

Eine Konfusionsmatrix, auch bekannt als Fehlermatrix, ist ein spezifisches Werkzeug, das in der Statistik und im maschinellen Lernen verwendet wird, um die Leistung eines Klassifikationsmodells zu visualisieren und zu analysieren. Sie ist besonders nützlich bei überwachten Lernaufgaben, wo die tatsächlichen Klassen (oder Labels) der Datenpunkte bekannt sind und mit den Vorhersagen des Modells verglichen werden können.

Die Konfusionsmatrix ist eine Tabelle mit zwei Dimensionen: die tatsächlichen Klassen und die vom Modell vorhergesagten Klassen. Für binäre Klassifikationsprobleme besteht die Matrix typischerweise aus vier Quadranten:

%%{init:{ 
    "theme": "dark",
    "themeVariables": {
        "quadrantTitleFill": "#999999",
        "quadrantXAxisTextFill": "#999999",
        "quadrantYAxisTextFill": "#999999",
        "quadrant1TextFill": "#ff8877",
        "quadrant2TextFill": "#339922",
        "quadrant3TextFill": "#ff8877",
        "quadrant4TextFill": "#339922"
    }
}
}%%
quadrantChart
    title Konfusionsmatrix
    x-axis "Prognose [0]" --> "Prognose [1]"
    y-axis "Test [1]" --> "Test [0]"
    quadrant-1 "False Positive (F+)"
    quadrant-2 "True Negative (T-)"
    quadrant-3 "False Negative (F-)"
    quadrant-4 "True Positive (T+)"

Quadrant	Beschreibung
True Positive (TP)	Die Anzahl der korrekt identifizierten positiven Fälle.
False Positive (FP)	Die Anzahl der fälschlicherweise als positiv (Fehler 1. Art) identifizierten negativen Fälle.
True Negative (TN)	Die Anzahl der korrekt identifizierten negativen Fälle.
False Negative (FN)	Die Anzahl der fälschlicherweise als negativ (Fehler 2. Art) identifizierten positiven Fälle.

Kennzahlen der Klassifikation

Genauigkeit (Accuracy)¹
Präzision (Precision)²
Sensitivität (Recall)³

Diese Metriken helfen, verschiedene Aspekte der Leistung eines Klassifikationsmodells zu verstehen, insbesondere in Szenarien, in denen die Klassen ungleich verteilt sind oder unterschiedliche Kosten für falsch positive und falsch negative Entscheidungen bestehen.

Anteil der insgesamt korrekten Vorhersagen. ↩
Anteil der tatsächlich positiven Fälle unter den als positiv vorhergesagten. ↩
Anteil der korrekt identifizierten positiven Fälle unter allen tatsächlichen positiven Fällen. ↩