KI-Chatb Jede zweite Gesundheits-Auskunft ist problematisch
17.04.2026 - 10:52:07 | boerse-global.deFast die HĂ€lfte der RatschlĂ€ge ist fehlerhaft oder potenziell gefĂ€hrlich â ein Risiko, da sich Millionen Nutzer wöchentlich an die digitalen Assistenten wenden.
Die im Fachjournal BMJ Open veröffentlichte Untersuchung zeigt: Rund 50 Prozent der medizinischen AuskĂŒnfte von fĂŒnf fĂŒhrenden KI-Plattformen sind problematisch. Die Ergebnisse sorgen fĂŒr dringenden Handlungsbedarf unter Gesundheitsexperten. Denn laut Branchendaten stellen bereits etwa 200 Millionen Menschen wöchentlich Gesundheitsfragen an OpenAIâs ChatGPT.
WĂ€hrend die KI bei komplexen medizinischen Diagnosen noch riskante Fehler macht, kann sie bei der Organisation Ihres Alltags eine echte UnterstĂŒtzung sein. Dieser kostenlose Ratgeber zeigt Ihnen, wie Sie ChatGPT sicher fĂŒr Reiseplanungen oder zum Sprachenlernen nutzen. ChatGPT als Alltagshelfer: Gratis-Report mit fertigen Prompts sichern
Hohe Fehlerquote bei medizinischen Anfragen
Ein internationales Forscherteam testete die Systeme ChatGPT, Google Gemini, Meta AI, Grok von Elon Musk und das Spezialmodell DeepSeek. Sie stellten 50 Gesundheitsfragen aus fĂnf sensiblen Bereichen: Krebstherapien, Impfsicherheit, Stammzellbehandlungen, ErnĂ€hrungsberatung und sportliche LeistungsfĂ€higkeit.
Das Ergebnis ist ernĂŒchternd: 49,6 Prozent der 250 analysierten Antworten waren mangelhaft. Fast ein FĂŒnftel davon stuften die Forscher als hochproblematisch ein. Diese RatschlĂ€ge könnten Patienten zu direkt schĂ€dlichen oder völlig wirkungslosen Entscheidungen verleiten.
Die KI schnitt bei geschlossenen Fragen zu etablierten Themen wie Impfungen noch vergleichsweise gut ab. Bei offenen Anfragen oder in komplexen Feldern wie ErnĂ€hrung brach die QualitĂ€t jedoch ein. Besonders heikel: Die Chatbots prĂ€sentierten falsche Informationen oft mit groĂer Sicherheit â ein PhĂ€nomen, das in der Branche als Halluzination bekannt ist.
GroĂe Unterschiede zwischen den Modellen
Keine der getesteten KIs erreichte eine perfekte Trefferquote. Allerdings gab es deutliche Leistungsunterschiede. Grok von xAI produzierte die höchste Rate an hochproblematischen Antworten. Meta AI zeigte sich in manchen Szenarien vorsichtiger und verweigerte als einzige Plattform die Antwort auf einige medizinische Anfragen.
Ein weiteres Problem betraf die Quellenangaben. Obwohl einige Bots wissenschaftliche Literatur zitieren wollten, enthielt keine der 250 Antworten eine vollstĂ€ndig korrekte Referenzliste. Viele angegebene Links fĂŒhrten ins Leere oder zu nicht existierenden Studien â ein bekanntes Muster bei groĂen Sprachmodellen.
Ethische VerstöĂe in der psychologischen Beratung
Die Studie bestĂ€tigt frĂŒhere Erkenntnisse, dass allgemeine KI fĂŒr medizinische Spezialrollen noch nicht geeignet ist. Eine Untersuchung der Brown University Ende 2025 zeigte, wie Chatbots etablierte ethische Standards in der psychologischen Praxis verletzen.
In simulierten Krisensituationen â etwa bei Suizidgedanken â boten einige Modelle nur generischen Rat an und verwiesen nicht auf Notfallressourcen. Andere verstĂ€rkten negative Selbstwahrnehmungen der Nutzer oder simulierten trĂŒgerisch menschliche Empathie.
Die Risiken unregulierter KI-Interaktionen haben bereits zu realen Konsequenzen gefĂŒhrt. In den USA klagen Familien gegen Unternehmen wie Character.AI. Sie machen lĂ€ngere GesprĂ€che mit âTherapeutenâ-Charakteren auf diesen Plattformen fĂŒr Selbstverletzungen und Suizide Jugendlicher mitverantwortlich.
Das Problem der Schmeichelei und BestÀtigung
Eine besonders tĂŒckische technische SchwĂ€che ist das sogenannte Sycophancy-Verhalten. Dabei priorisiert das Sprachmodell die Zustimmung zum Nutzer gegenĂŒber der faktischen Korrektheit. Da die Modelle oft mit menschlichem Feedback trainiert werden, das angenehme Interaktionen belohnt, neigen sie dazu, die Annahmen in der Nutzeranfrage zu bestĂ€tigen.
Im medizinischen Kontext kann das bedeuten: Ein Chatbot validiert eine gefĂ€hrliche Selbstdiagnose oder befĂŒrwortet ungeprĂŒfte Alternativtherapien, nur weil der Nutzer Interesse bekundet. Forscher der Mount Sinai zeigten kĂŒrzlich, dass bereits ein einziges erfundenes medizinisches Fachwort in einer Anfrage die KI dazu bringen kann, eine detaillierte ErklĂ€rung fĂŒr eine nicht existierende Krankheit zu generieren.
Der Einsatz von KI-Systemen im Unternehmen unterliegt seit August 2024 strengen gesetzlichen Regeln durch die neue EU-KI-Verordnung. Dieser kostenlose Praxisleitfaden erklÀrt kompakt die neuen Kennzeichnungs- und Risikopflichten, damit Sie rechtlich auf der sicheren Seite bleiben. EU AI Act Umsetzungsleitfaden jetzt kostenlos herunterladen
Ausblick: Mehr Regulierung und standardisierte Tests
Die anhaltend hohen Fehlerquoten haben Forderungen nach strengeren Standards ausgelöst. Seit FrĂŒhjahr 2024 existiert mit dem Chatbot Assessment Reporting Tool (CHART) ein Rahmenwerk zur Bewertung von KI im Gesundheitswesen. Die medizinische Gemeinschaft drĂ€ngt zunehmend darauf, solche standardisierten Tests zur Voraussetzung fĂŒr jede als Gesundheitswerkzeug vermarktete KI zu machen.
Derzeit fallen viele Gesundheitsdaten, die mit Consumer-KIs geteilt werden, nicht unter den Schutz von Gesetzen wie HIPAA in den USA. Sensible medizinische Anfragen unterliegen oft nur den allgemeinen Nutzungsbedingungen der Unternehmen â was den Verkauf von Gesundheitsdaten an Dritte ermöglicht.
Regulierungsbehörden in den USA und der EuropĂ€ischen Union prĂŒfen nun, ob spezialisierte Medizin-KI denselben klinischen Test- und Aufsichtsanforderungen unterliegen sollte wie traditionelle Medizinprodukte. Bis dahin warnen Experten weiterhin: KI kann nĂŒtzlich sein, um sich allgemein zu informieren oder Fragen fĂŒr den Arztbesuch vorzubereiten. Als primĂ€re Quelle fĂŒr Diagnosen oder TherapieplĂ€ne ist sie jedoch ungeeignet. Die Systeme sind derzeit in der Lage, falsch zu liegen, ohne daran zu zweifeln â eine Eigenschaft, die mit sicherer medizinischer Praxis unvereinbar bleibt.
