Wie funktioniert Künstliche Intelligenz?

Einführung

ChatGPT schreibt Essays, DALL-E malt Bilder, Siri versteht Sprachbefehle, und dein Handy entsperrt sich mit deinem Gesicht. All das läuft unter dem Begriff „Künstliche Intelligenz” — aber was ist das eigentlich?

Viele denken bei KI an Roboter mit Bewusstsein oder an Superintelligenzen wie aus Science-Fiction-Filmen. Die Realität ist nüchterner — aber nicht weniger faszinierend. KI ist kein Zaubertrick und kein Wesen mit eigenen Gedanken. Es ist eine Sammlung von Algorithmen und Rechenverfahren, die aus Mustern in Daten lernen.

Um KI verstehen zu können, musst du nicht programmieren können. Du musst aber die Grundidee kennen: Wie kommt ein Computer dazu, etwas zu „können” — ohne dass man ihm eine explizite Regel programmiert hat?

Grundidee

Klassische Programmierung funktioniert so: Der Programmierer schreibt explizite Regeln, der Computer befolgt sie. „Wenn die E-Mail das Wort ‚Lotterie’ enthält, schieb sie in Spam.”

Machine Learning dreht das um: Der Computer bekommt viele Beispiele (Daten), und er leitet selbst Regeln daraus ab. Du zeigst ihm tausende Spam-Mails und tausende legitime Mails — und er lernt, was Spam von Nicht-Spam unterscheidet.

Das ist der entscheidende Unterschied: Nicht Regeln programmieren, sondern Muster lernen.

Erklärung

KI ≠ Roboter ≠ Allgemeine Intelligenz

Ein paar wichtige Abgrenzungen:

KI ist ein breiter Begriff für Computersysteme, die Aufgaben erledigen, die normalerweise menschliche Intelligenz erfordern.
Maschinelles Lernen (ML) ist eine Methode der KI: Systeme lernen aus Daten, statt explizit programmiert zu werden.
Deep Learning ist ein Teilbereich von ML, der auf künstlichen neuronalen Netzen mit vielen Schichten basiert.
Allgemeine KI (AGI — Artificial General Intelligence) ist ein System, das wie ein Mensch über alle Bereiche hinweg denken kann. Das gibt es heute noch nicht.

Die KI-Systeme, die du täglich nutzt, sind schmale KI: Sie können eine bestimmte Aufgabe sehr gut — aber nur diese eine.

Symbolische KI vs. Machine Learning

In den 1950er bis 1980er Jahren war die dominante KI-Methode symbolisch: Man versuchte, menschliches Wissen in explizite Regeln zu übersetzen. Wenn-Dann-Ketten. Logik. Entscheidungsbäume, die Experten formulierten.

Das funktionierte gut für klar definierte Probleme wie Schach oder Beweisassistenten. Aber beim Erkennen von Katzen auf Fotos? Da kann niemand die Regeln explizit formulieren. Es gibt einfach zu viele Ausnahmen, Varianten, Kontexte.

Machine Learning löst das durch Daten statt Regeln.

Supervised Learning

Das häufigste Paradigma im Machine Learning ist Supervised Learning (überwachtes Lernen):

Trainingsdaten: Du hast viele Beispiele, die bereits mit der richtigen Antwort beschriftet sind (Labels). Bei einem Spamfilter: 10.000 Mails, jede markiert als „Spam” oder „Kein Spam”.
Modelltraining: Ein Algorithmus schaut sich die Daten an und lernt Muster. Er versucht, die Labels vorherzusagen — und korrigiert sich, wenn er falsch liegt.
Vorhersage: Das trainierte Modell bekommt neue, unbekannte Mails und klassifiziert sie.

Beispiel Spamfilter: Das Modell lernt: Bestimmte Wörter, Absender-Domänen, HTML-Strukturen und Muster treten in Spam-Mails häufiger auf. Es lernt keine Regel „wenn Wort X dann Spam” — es lernt eine komplexe Kombination aus Hunderten schwacher Signale.

Neuronale Netze

Neuronale Netze sind heute die leistungsstärkste Klasse von ML-Modellen. Die Grundidee ist lose vom Gehirn inspiriert.

Aufbau:

Das Netz besteht aus Schichten (Layers): Eine Eingabeschicht, eine oder mehrere versteckte Schichten (hidden layers), und eine Ausgabeschicht.
Jede Schicht enthält Neuronen (Knoten).
Neuronen sind durch Gewichte verbunden: Diese Gewichte bestimmen, wie stark ein Signal weitergegeben wird.

Vorwärtspropagation: Eingabedaten (z. B. Pixel eines Bildes) fließen durch das Netz. Jedes Neuron berechnet eine gewichtete Summe seiner Eingaben und wendet eine Aktivierungsfunktion an (z. B. ReLU: alles unter 0 wird 0). Das Ergebnis wird an die nächste Schicht weitergegeben.

Training: Das Netz macht zunächst zufällige Vorhersagen. Eine Verlustfunktion misst, wie falsch die Vorhersage war. Dann wird ein Verfahren namens Backpropagation angewendet: Der Fehler wird rückwärts durch das Netz propagiert, und die Gewichte werden minimal angepasst — in Richtung kleineren Fehlers (Gradient Descent). Das passiert tausende oder Millionen Mal.

Deep Learning

Deep Learning bedeutet: neuronale Netze mit vielen (tiefen) versteckten Schichten. Durch diese Tiefe können Netze sehr abstrakte Hierarchien von Merkmalen lernen: Ein Bilderkennungsnetz lernt in frühen Schichten Kanten und Farben, in mittleren Schichten Formen, in späten Schichten Konzepte wie „Katze” oder „Auto”.

Transformer und LLMs

Moderne Sprachmodelle wie GPT (ChatGPT) basieren auf einer Architektur namens Transformer (2017 von Google Brain entwickelt). Transformer verarbeiten Text nicht Wort für Wort, sondern alle Elemente gleichzeitig und berechnen Attention: Wie viel Aufmerksamkeit muss Wort A auf Wort B richten, um den Kontext zu verstehen?

Large Language Models (LLMs) sind riesige Transformer-Modelle, trainiert auf hunderten Milliarden Textwörtern. Sie lernen kein „Verständnis”, sondern statistische Muster: Welche Wörter folgen wahrscheinlich auf welche?

Overfitting

Overfitting ist ein häufiges Problem: Das Modell lernt die Trainingsdaten so gut auswendig, dass es auf neue, unbekannte Daten schlecht abschneidet. Es hat die Beispiele memoriert, statt allgemeine Muster zu lernen.

Vergleich: Ein Schüler lernt alle Beispielaufgaben auswendig, aber besteht das Abitur nicht, weil andere Aufgaben auftauchen. Er hat „overfittet”.

Gegenmittel: Mehr Trainingsdaten, Regularisierung, Testdaten zur Überprüfung.

Bias in KI

KI-Systeme sind nicht neutral — sie spiegeln die Daten wider, auf denen sie trainiert wurden. Wenn historische Entscheidungen diskriminierend waren, lernt das Modell diese Diskriminierung.

Beispiel: Ein Bewerbungsfilter, der auf historischen Einstellungsentscheidungen trainiert wurde, bevorzugt möglicherweise Männer — weil die meisten vergangenen Einstellungen Männer waren. Das System hat keine böse Absicht; es lernt das Muster.

Oder: Gesichtserkennung, die für hellhäutige Gesichter besser trainiert wurde, macht mehr Fehler bei dunkleren Hauttönen.

Beispiel aus dem Alltag

Gesichtserkennung auf deinem Handy:

Dein Handy wurde trainiert: Hunderte Fotos deines Gesichts wurden aufgenommen, gespeichert und ein neuronales Netz darauf trainiert. Es lernte die Proportionen, Konturen, Abstände — kein explizites Regelset, sondern ein Muster in Gewichten.

Wenn du nun dein Handy entsperrst, nimmt die Kamera ein Bild auf, das Netz vergleicht es mit dem gelernten Muster — und gibt ein Konfidenz-Score aus: „Zu 99,7 % stimmt das Gesicht überein.”

Empfehlungssystem bei Spotify:

Spotify analysiert, was du hörst: Welche Songs, wie lange, was du überspringst. Und: Was Menschen mit ähnlichem Geschmack hören. Ein Modell lernt Muster in diesen Daten und empfiehlt Musik, die du wahrscheinlich magst — ohne jemals die „Regeln guten Geschmacks” formuliert zu haben.

Sprachassistent:

Siri oder der Google Assistant verarbeiten deine Sprache mit einem neuronalen Netz: erst Audiosignal → Text (Spracherkennung), dann Text → Bedeutung (Sprachverständnis), dann Bedeutung → Antwort (Sprachgenerierung). Jeder Schritt ist ein eigenes Modell.

Anwendung

Überlege für jeden der folgenden Fälle:

Was ist die Eingabe (Input), was die gewünschte Ausgabe (Output)?
Welche Art von Trainingsdaten würde man brauchen?
Welches Risiko durch Bias oder Overfitting besteht?

Medizinische Diagnose: Ein KI-System soll aus Röntgenbildern Tumore erkennen.
Kreditbewilligung: Eine Bank verwendet KI, um Kreditanträge zu bewerten.
Textübersetzung: Ein System übersetzt Deutsch nach Englisch.

Typische Fehler

KI versteht nicht: Ein Sprachmodell, das perfekte Sätze produziert, „versteht” die Bedeutung nicht im menschlichen Sinne. Es modelliert statistische Muster. Das erklärt, warum LLMs manchmal plausibel klingende Falschinformationen produzieren (Halluzinationen).

Mehr Daten lösen alle Probleme: Mehr schlechte oder verzerrte Daten erzeugen nur skaliertes Bias. Qualität und Repräsentativität der Trainingsdaten sind entscheidend.

KI ist objektiv: KI-Entscheidungen wirken präzise und neutral, sind aber so subjektiv wie die Daten und Designentscheidungen, die in sie eingeflossen sind.

Training = Funktion: Das trainierte Modell ist keine Datenbank der Trainingsdaten. Es sind Millionen von Gewichten, die Muster kodieren. Einzelne Trainingsdaten sind meist nicht mehr rekonstruierbar.

Zusammenfassung

KI ist keine allgemeine Intelligenz, sondern spezialisierte Algorithmen, die Muster aus Daten lernen
Machine Learning dreht klassische Programmierung um: statt Regeln zu schreiben, lernt das System Regeln aus Beispielen
Supervised Learning braucht beschriftete Trainingsdaten und lernt durch Fehlerkorrektur (Backpropagation + Gradient Descent)
Neuronale Netze bestehen aus Schichten von Neuronen mit Gewichten; Deep Learning nutzt viele solcher Schichten für abstrakte Merkmalshierarchien
Transformer-Architekturen ermöglichen LLMs wie GPT; sie lernen statistische Sprachmuster aus riesigen Textmengen
Overfitting, Bias und Halluzinationen sind reale Limitationen, die es beim Umgang mit KI zu kennen gilt

Quiz

Frage 1: Was ist der Unterschied zwischen klassischer Programmierung und Machine Learning?

Frage 2: Was bedeutet Overfitting — und was kann man dagegen tun?

Frage 3: Warum können KI-Systeme diskriminierend sein — obwohl sie keine eigenen Absichten haben?

Frage 4: Was ist der grundlegende Unterschied zwischen einem einfachen neuronalen Netz und einem Transformer (wie GPT)?