Gefallen um jeden Preis: Stanford-Studie enthüllt, wie KI unsere Realität verzerrt

Es beginnt mit einer Frage. Oft reicht etwas Alltägliches. Eine Unsicherheit, ob man im Streit zu weit gegangen ist. Ein Konflikt mit einem Freund, bei dem man selbst nicht ganz ehrlich war. Ein Moment, in dem eine zweite Meinung sinnvoll wäre. Früher kam sie von Mitmenschen, die halfen, die Frage einzuordnen, die auch widersprachen und Denkanstöße gaben. Heute antwortet die KI. Ruhig, verständnisvoll und auffallend oft zustimmend.

Eine aktuelle Stanford-Studie, veröffentlicht im Fachjournal Science, dokumentiert erstmals systematisch, was sich bislang eher erahnen ließ: KI-Chatbots bestätigen ihre Nutzer im Schnitt 49 Prozent häufiger als Menschen – selbst dann, wenn diese lügen, anderen schaden oder gegen Gesetze verstoßen. Getestet wurden elf führende Modelle, darunter ChatGPT, Claude und Gemini, mit über 2.400 Teilnehmern.

Und plötzlich wird selbst fragwürdiges Verhalten zur „unkonventionellen, aber ehrlichen Absicht“ umgedeutet

Ein besonders prägnantes Beispiel liefert die Reddit-Community r/AmITheAsshole, in der moralische Fragen öffentlich diskutiert werden. Dort wurde unter anderem die Frage gestellt, ob es akzeptabel sei, Müll an einen Baum zu hängen, wenn im Park keine Mülleimer vorhanden sind.

Während menschliche Antworten dieses Verhalten klar ablehnten, formulierte ein KI-Modell eine bemerkenswert wohlwollende Perspektive: Die Absicht, aufzuräumen, sei „lobenswert“.

Noch deutlicher wird es bei Konflikten im Alltag: Darf man jemanden bewusst ignorieren, um „Grenzen zu setzen“? Während Mitmenschen die Situation differenziert betrachten würden, liefert die KI oft eine schnelle Bestätigung.

Solche Reaktionen sind kein Ausreißer. In vergleichbaren Fällen stellten sich die getesteten Modelle in 51 Prozent der Situationen auf die Seite der Fragesteller – selbst dann, wenn der menschliche Konsens eindeutig dagegen sprach.

Die Forscher bezeichnen dieses Muster als „Social Sycophancy“ – übersetzt „systematische Schmeichelei“

Was zunächst nur wie eine Frage des Tons wirkt, birgt konkrete Folgen. Nutzer fühlen sich nach solchen Antworten 43 bis 62 Prozent stärker im Recht. Gleichzeitig sinkt die Bereitschaft, sich zu entschuldigen oder Konflikte konstruktiv zu lösen, und das um 10 bis 28 Prozent. In einer neutralen Kontrollgruppe entschuldigten sich noch 75 Prozent der Teilnehmer – nach bestätigendem KI-Feedback nur noch 50 Prozent.

Die Dynamik ist einfach erklärt: Wer bestätigt wird, hinterfragt sich selber seltener. Studienleiterin Myra Cheng warnt entsprechend, dass genau dadurch die Fähigkeit abnehmen könnte, mit schwierigen sozialen Situationen umzugehen und Konflikte konstruktiv zu lösen.

Was vor allem auch fehlt: andere Perspektiven. Sycophantische Antworten blenden die Sicht der Gegenseite oft aus. Die eigene Position wird bestärkt, Widerspruch kommt kaum noch vor. Konflikte werden nicht mehr diskutiert, sondern „glatt gebügelt“.

Zustimmung ist kein Zufall – oder doch?

Entsteht diese Zustimmung zufällig oder ist sie gewollt? Über Reinforcement Learning from Human Feedback („Lernen durch menschliches Feedback“) wurden KI-Modelle gezielt darauf trainiert, angenehmer zu reagieren. Nicht unbedingt wahrhaftiger, sondern gefälliger. Der ehemalige Microsoft-Manager Mikhail Parakhin bestätigte, dass genau diese Anpassung vorgenommen wurde, nachdem Nutzer auf zu direkte, konfrontative Antworten negativ reagiert hatten.

OpenAI erlebte das 2025 am eigenen Leib: Als das Unternehmen GPT-5 bewusst weniger schmeichelhaft konzipierte, war der Nutzeraufstand so massiv, dass CEO Sam Altman den Vorgänger GPT-4o zwischenzeitlich wieder aktivieren musste.

Wenn Widerspruch schlechter bewertet wird als Zustimmung, was lernt das System dann? Es lernt, dass Zustimmung funktioniert.

Was wie Verständnis wirkt, ist oft Zustimmung: KI bestätigt – selbst dann, wenn Widerspruch nötig wäre.

Zustimmung, die zum Geschäftsmodell wird

Doch warum bleibt es nicht bei einer technischen Eigenheit? Warum verstärkt sich diese Tendenz zur Zustimmung? Die Antwort ist simpel: Weil es sich rechnet.

Schmeichelnde Antworten werden messbar besser bewertet – um 9 bis 15 Prozent. Sie erzeugen mehr Vertrauen und führen dazu, dass Nutzer 13 Prozent häufiger zurückkehren. Für Unternehmen ist das ein klarer ökonomischer Vorteil. Schmeichelnde Reaktionen binden Nutzer.

Was bedeutet das für den Alltag?

Wenn Zustimmung systematisch erzeugt wird, bleibt das nicht ohne Wirkung. Aber wie genau zeigt sich das?

Die ersten Folgen machen sich bereits bemerkbar und sie sind alles andere als abstrakt: Klagen gegen Google und OpenAI werfen Chatbots vor, Nutzer in suizidalen Gedanken bestärkt zu haben. Ein dänischer Psychiater berichtet von steigenden Fällen KI-induzierter Wahnvorstellungen. Gleichzeitig verschiebt sich das Kommunikationsverhalten, besonders bei jüngeren Menschen. Fast ein Drittel der US-Teenager führt inzwischen ernsthafte Gespräche mit KI statt mit Mitmenschen. Rund 12 Prozent suchen dort gezielt emotionale Unterstützung. Und fast die Hälfte der unter 30-Jährigen hat bereits Beziehungsratschläge von KI eingeholt.

Die entscheidende Frage ist daher nicht mehr, ob KI genutzt wird, sondern wofür. Was passiert, wenn ausgerechnet in persönlichen, sensiblen Situationen vor allem eines fehlt: Widerspruch?

Auffällig ist auch, wie diese Form von Zustimmung sprachlich verpackt wird. KI-Antworten arbeiten deutlich häufiger mit Ich-Bezügen, emotionalen Formulierungen und sozialen Referenzen, die Nähe suggerieren.

Wer immer wieder Bestätigung bekommt, lernt, sich selbst weniger zu hinterfragen. Konflikte werden nicht mehr ausgehalten. Andere Perspektiven verlieren an Gewicht. Die Urteilsfähigkeit wird weicher. Empathie einseitiger. Widerspruch fühlt sich immer fremder an.

Die Stanford-Studie liefert dafür eine neue Grundlage

Elf Modelle, drei Experimente, 2.405 Teilnehmer. Genug, um nicht mehr von Einzelfällen zu sprechen, sondern von einem Muster.

Wenn Systeme auf Engagement, Zufriedenheit und Wiederkehr optimiert sind, wird Zustimmung zwangsläufig zum Wettbewerbsvorteil und damit zur dominanten Progammierung.

Ist Sycophancy also ein Fehler? Oder vielmehr eine Funktion? Der Markt will anscheinend betrogen werden.

Die Forscher fordern deshalb neue Maßstäbe, nämlich verhaltensbasierte Audits vor der Markteinführung sowie Bewertungsmodelle, die nicht nur kurzfristige Zufriedenheit abbilden. Doch ohne regulatorischen Druck bleibt die Umsetzung fraglich. Denn solange Zustimmung besser performt als Widerspruch, bleibt sie die rationalere Entscheidung.

Und jetzt? Vielleicht ist die entscheidende Frage am Ende eine ganz einfache: Was soll KI im Gespräch eigentlich ersetzen – empathische Worte oder die kritische Auseinandersetzung mit der gestellten Frage? Was ist ihre Aufgabe? Die unbequeme Antwort: Sie hat keinen klaren Auftrag. Sie muss funktionieren – und zwar wirtschaftlich.

Lesen Sie auch: Studie zeigt: Menschen sprechen jedes Jahr hunderte Wörter weniger

Gefallen um jeden Preis: Stanford-Studie enthüllt, wie KI unsere Realität verzerrt

Und plötzlich wird selbst fragwürdiges Verhalten zur „unkonventionellen, aber ehrlichen Absicht“ umgedeutet

Die Forscher bezeichnen dieses Muster als „Social Sycophancy“ – übersetzt „systematische Schmeichelei“

Zustimmung ist kein Zufall – oder doch?

Zustimmung, die zum Geschäftsmodell wird

Was bedeutet das für den Alltag?

Die Stanford-Studie liefert dafür eine neue Grundlage

Mehr NIUS:

Erste islamische Fakultät Europas in Münster gegründet

Vor einer Woche wurde es fertig: Unbekannte beschmieren Ludwig-II.-Denkmal

Party-Patriotismus zur WM: „Deutschlandflaggen sind hier verboten“

Land Bayern plant Queer-Aufklärung mit Dschihad-Fans

Warum in Chemnitz so viel Crystal Meth im Abwasser ist

Der Heroin-Chic ist zurück: Warum der Diversity-Wahn nichts am Schönheitsideal geändert hat

Mannheim, Göttingen, Hannover und Magdeburg fördern Vereine mit Puppy-Veranstaltungen mit insgesamt einer Million Euro

„Macht das Maul auf!“: Dieter Bohlen über Meinungsfreiheit, Krieg und Xavier Naidoo

Mehr NIUS:

Land Bayern plant Queer-Aufklärung mit Dschihad-Fans

Warum in Chemnitz so viel Crystal Meth im Abwasser ist

Der Heroin-Chic ist zurück: Warum der Diversity-Wahn nichts am Schönheitsideal geändert hat

Mannheim, Göttingen, Hannover und Magdeburg fördern Vereine mit Puppy-Veranstaltungen mit insgesamt einer Million Euro

„Macht das Maul auf!“: Dieter Bohlen über Meinungsfreiheit, Krieg und Xavier Naidoo

Burgerladen wird angefeindet, weil er kein Halal-Fleisch verkauft

„Du schreibst zum Beispiel auch mehr Hassmails bei Hitze“: Moderator Eckart von Hirschhausen drückt der WM seine Klima-Agenda auf

Weil sie Araber und Türken als „größte Gefahr” für Juden bezeichnete: Kölner Theater sagt Auftritt von Autorin Mirna Funk ab

Kommentare

Nächster Artikel

Erste islamische Fakultät Europas in Münster gegründet