Von den Empfehlungsalgorithmen von Netflix über die Gesichtserkennung im Handy bis hin zu medizinischer Diagnosesoftware – maschinelles Lernen hat Einzug in den Alltag gehalten. In diesem Artikel zeigen wir, wie es sich vom klassischen Programmieren unterscheidet, wie Computer aus Daten lernen, welche Hauptarten des Lernens es gibt und warum die Qualität der Daten sowie die Erklärbarkeit der Ergebnisse genauso wichtig sind wie die Genauigkeit selbst.
Künstliche Intelligenz ist ein weiter Begriff, doch die meisten modernen Systeme, die wir als KI bezeichnen, nutzen in Wirklichkeit maschinelles Lernen. Ob Sie empfohlene Filme auf Netflix ansehen, mit einem Chatbot im Onlineshop kommunizieren oder Ihr Handy Ihr Gesicht erkennt – hinter all dem steckt ein Algorithmus, der aus einer riesigen Menge an Daten gelernt hat. Wie MIT Sloan erklärt, ist maschinelles Lernen heute die entscheidende Methode, mit der sich die meisten KI-Systeme entwickeln.
Die Grundidee ist dabei relativ einfach. Anstatt dass Programmierer dem Computer exakt vorschreiben, was er tun soll, lassen sie ihn dies anhand von Beispielen selbst erlernen. Das ist der wesentliche Unterschied zum klassischen Programmieren, bei dem jeder Schritt manuell definiert werden muss. Beim maschinellen Lernen ist das Ziel dagegen, ein Modell zu schaffen, das sich neuen Situationen anpassen und auf Grundlage bisheriger Erfahrungen Entscheidungen treffen kann.
Maschinelles Lernen ist daher eher wie die Einarbeitung eines Mitarbeiters als das Schreiben einer Maschinenanleitung. Wir schreiben keine konkreten Regeln, sondern liefern Daten und Feedback. Der Computer versucht dann, eigene Wege zu finden, um zu den richtigen Ergebnissen zu gelangen.
Jedes System des maschinellen Lernens beginnt mit Daten. Diese können praktisch alles sein – Texte, Zahlen, Bilder, Ton, Video, aber auch Sensordaten oder Banktransaktionen. Diese Daten werden zunächst in eine Form gebracht, mit der der Algorithmus arbeiten kann. Oft müssen sie von Fehlern bereinigt, in ein einheitliches Format gebracht oder in einzelne Teile zerlegt werden. In dieser Phase wird auch entschieden, welche Daten wir zum Trainieren des Modells verwenden und welche für die spätere Überprüfung der Ergebnisse zurückgehalten werden.
Es folgt die Wahl eines geeigneten Modells. Dies ist im Grunde ein mathematisches Werkzeug, das in den Daten Muster erkennen soll. Manchmal reichen einfache statistische Methoden aus, in anderen Fällen sind komplexere neuronale Netze mit vielen Schichten erforderlich. In einem solchen Fall sprechen wir von Deep Learning. Genau dieser Ansatz bildet die Grundlage der meisten heutigen fortgeschrittenen KI-Systeme – von selbstfahrenden Autos bis zu generativen Modellen wie ChatGPT. Das Modell lernt beim Training, die „richtigen Antworten zu erraten“ und passt sein internes System schrittweise an, um diese Vorhersagen zu verbessern.
Während des Trainings lernt das System also, wie es aus bestimmten Eingaben zu den richtigen Ausgaben gelangt. Wenn es zum Beispiel Tiere auf Fotos erkennt, weiß es anfangs nicht, was einen Hund zu einem Hund macht. Doch mit jedem weiteren Bild, das es sieht, und mit jeder richtigen Antwort, die es erhält, passt es seine innere Vorstellung davon an, was für einen Hund typisch ist. Nach einigen tausend Wiederholungen kann es dann auch auf einem neuen Foto, das es noch nie gesehen hat, einen Hund erkennen.
Das fertige Modell wird anschließend mit bisher unbekannten Daten getestet, um festzustellen, wie gut es generalisiert. Wenn es eine ausreichende Genauigkeit erreicht, kann es in den Einsatz gehen – sei es als Empfehlungsalgorithmus, Diagnosetool oder Steuerung eines Roboterarms in der Produktion.
Je nachdem, wie wir mit den Daten arbeiten, unterscheiden wir drei Hauptansätze des maschinellen Lernens.
Die Aufzählung der Bereiche, in denen maschinelles Lernen Anwendung findet, ist nahezu unendlich. Im E-Commerce empfiehlt es Produkte basierend auf dem bisherigen Verhalten der Kunden. Im Gesundheitswesen hilft es, MRT-Aufnahmen zu analysieren oder Krankheitsrisiken vorherzusagen. Im Bankwesen deckt es betrügerische Transaktionen auf und bewertet die Kreditwürdigkeit von Kunden. In der Produktion prognostiziert es Maschinenstörungen anhand von Sensordaten und im Geschäftsleben allgemein kann es etwa Marketingstrategien anhand wirtschaftlicher Ergebnisse auswerten und vorschlagen.
Im Alltag begegnen wir ihm etwa bei mobilen Anwendungen, die Sprache erkennen oder Fremdsprachen übersetzen, bei autonomen Fahrzeugen oder in sozialen Netzwerken, wo Algorithmen entscheiden, welche Beiträge wir sehen. Natürlich beruhen auch die bekanntesten Chatbots wie ChatGPT, Gemini oder Copilot auf maschinellem Lernen und dem Training mit Milliarden von Eingabedaten.
Auch wenn die Ergebnisse des maschinellen Lernens oft beeindruckend sind, hat die Technologie ihre Grenzen. Ein Modell lernt nur aus dem, was wir ihm geben. Wenn die Daten unvollständig, verzerrt oder anderweitig problematisch sind, kann das Modell menschliche Vorurteile übernehmen und reproduzieren. Bekannt sind Fälle, in denen ein Algorithmus bestimmte Personengruppen bei der Kreditvergabe diskriminierte oder bestimmte Arten von Inhalten aufgrund zufälliger Korrelationen bevorzugte.
Ein weiteres Problem ist die sogenannte Nicht-Interpretierbarkeit von Modellen. Bei komplexeren Systemen wie tiefen neuronalen Netzen ist es schwer zu sagen, warum ein Modell zu einem bestimmten Schluss gekommen ist. Das ist besonders heikel in Bereichen, in denen Entscheidungen rückverfolgbar erklärt werden müssen, etwa in der Medizin oder im Justizwesen.
Eine weitere Schwäche ist die Anfälligkeit für Manipulation. Schon eine kleine Änderung in den Daten kann dazu führen, dass ein Modell einen gravierenden Fehler macht. So hat etwa ein Algorithmus, der Hunde und Katzen erkennen sollte, einen Hund als Strauß klassifiziert, weil jemand die Metadaten des Fotos verändert hatte.
Nicht zuletzt gilt: Nicht jedes Problem eignet sich für maschinelles Lernen. In vielen Unternehmen besteht die Tendenz, KI dort einzusetzen, wo ein einfaches Skript oder eine menschliche Entscheidung ausreichen würde. Fachleute raten daher oft, beim Problem zu beginnen, nicht bei der Technologie. Zuerst muss klar sein, was man lösen möchte, und erst danach sollte man überlegen, ob maschinelles Lernen die richtige Lösung ist.
Maschinelles Lernen ist ein leistungsfähiges Werkzeug, das es Computern ermöglicht, aus Daten zu lernen, Muster zu erkennen und Entscheidungen ohne explizite Programmierung zu treffen. Es hat enormes Potenzial, Effizienz, Servicequalität und Anpassungsfähigkeit an die Bedürfnisse der Nutzer zu verbessern. Gleichzeitig bringt es neue Risiken mit sich – von Vorurteilen bis hin zu Fehlinterpretationen der Ergebnisse. Deshalb ist es wichtig, nicht nur zu verstehen, was maschinelles Lernen kann, sondern auch, was es nicht kann. Und wenn Ihnen KI jemals etwas Wichtiges empfiehlt, sollten Sie sich fragen, auf welchen Daten das basiert. Manchmal wird es hervorragend funktionieren. Und manchmal wird es Ihnen einen Schokoladenkuchen mit Huhn vorschlagen – so wie in einem berühmten Experiment zur Rezeptgenerierung.