Metriken der Klassifikation
Konfusionsmatrix
Eine Konfusionsmatrix, auch bekannt als Fehlermatrix, ist ein spezifisches Werkzeug, das in der Statistik und im maschinellen Lernen verwendet wird, um die Leistung eines Klassifikationsmodells zu visualisieren und zu analysieren. Sie ist besonders nützlich bei überwachten Lernaufgaben, wo die tatsächlichen Klassen (oder Labels) der Datenpunkte bekannt sind und mit den Vorhersagen des Modells verglichen werden können.
Die Konfusionsmatrix ist eine Tabelle mit zwei Dimensionen: die tatsächlichen Klassen und die vom Modell vorhergesagten Klassen. Für binäre Klassifikationsprobleme besteht die Matrix typischerweise aus vier Quadranten:
%%{init:{
"theme": "dark",
"themeVariables": {
"quadrantTitleFill": "#999999",
"quadrantXAxisTextFill": "#999999",
"quadrantYAxisTextFill": "#999999",
"quadrant1TextFill": "#ff8877",
"quadrant2TextFill": "#339922",
"quadrant3TextFill": "#ff8877",
"quadrant4TextFill": "#339922"
}
}
}%%
quadrantChart
title Konfusionsmatrix
x-axis "Prognose [0]" --> "Prognose [1]"
y-axis "Test [1]" --> "Test [0]"
quadrant-1 "False Positive (F+)"
quadrant-2 "True Negative (T-)"
quadrant-3 "False Negative (F-)"
quadrant-4 "True Positive (T+)"
Quadrant | Beschreibung |
---|---|
True Positive (TP) | Die Anzahl der korrekt identifizierten positiven Fälle. |
False Positive (FP) | Die Anzahl der fälschlicherweise als positiv (Fehler 1. Art) identifizierten negativen Fälle. |
True Negative (TN) | Die Anzahl der korrekt identifizierten negativen Fälle. |
False Negative (FN) | Die Anzahl der fälschlicherweise als negativ (Fehler 2. Art) identifizierten positiven Fälle. |
Kennzahlen der Klassifikation
Diese Metriken helfen, verschiedene Aspekte der Leistung eines Klassifikationsmodells zu verstehen, insbesondere in Szenarien, in denen die Klassen ungleich verteilt sind oder unterschiedliche Kosten für falsch positive und falsch negative Entscheidungen bestehen.