ML | Machine Learning

Lernparadigmen

Machine Learning basiert auf verschiedenen Lernparadigmen, die sich in der Art unterscheiden, wie Modelle trainiert werden:

Überwachtes Lernen (Supervised Learning): Das Modell wird mit gelabelten Daten trainiert, d. h. es erhält Eingaben zusammen mit den korrekten Ausgaben. Beispiele sind Klassifikations- und Regressionsprobleme.
Unüberwachtes Lernen (Unsupervised Learning): Hier werden Muster und Strukturen in Daten ohne vordefinierte Labels gefunden. Clustering-Algorithmen wie k-Means oder PCA gehören zu dieser Kategorie.
Bestärkendes Lernen (Reinforcement Learning): Ein Agent lernt durch Interaktion mit seiner Umgebung und erhält Belohnungen oder Strafen, um optimale Strategien zu entwickeln. Dies wird z. B. in der Robotik und bei Spielen eingesetzt.

Machine Learning umfasst eine Vielzahl von Algorithmen, die für verschiedene Aufgaben eingesetzt werden:

Lineare Regression: Ein einfaches Modell zur Vorhersage kontinuierlicher Werte auf Basis linearer Zusammenhänge.
Logistische Regression: Wird zur Klassifikation genutzt und berechnet Wahrscheinlichkeiten für bestimmte Kategorien.
Entscheidungsbäume: Hierarchische Modelle, die datenbasierte Entscheidungen durch Sequenzen von Bedingungen treffen.
Boosting-Modelle: Ensemble-Methoden wie XGBoost oder CatBoost kombinieren schwache Klassifikatoren zu einem starken Modell.
Neuronale Netze: Inspiriert vom menschlichen Gehirn, bestehen sie aus mehreren Schichten von Neuronen und sind besonders leistungsfähig in Deep-Learning-Anwendungen.

Die Optimierung von Hyperparametern ist entscheidend für die Leistung eines Machine-Learning-Modells. Zwei zentrale Konzepte sind:

Pipelines: Sie helfen, den gesamten ML-Workflow zu strukturieren, indem Vorverarbeitung, Modelltraining und Evaluierung automatisiert werden.
Kreuzvalidierung ist eine Technik zur Modellbewertung, bei der die verfügbaren Daten in mehrere Teilmengen aufgeteilt werden, um das Modell auf verschiedenen Trainings- und Testsets zu testen und so eine robustere Einschätzung der Modellleistung zu erhalten.

Durch das richtige Feintuning dieser Parameter kann die Genauigkeit und Robustheit eines Modells erheblich verbessert werden.