Foto: shutterstock
Die Krankenhausreform verlangt mehr Qualität, mehr Transparenz, mehr Daten und das mit weniger Personal. Künstliche Intelligenz gilt als Lösung für diesen Widerspruch. Doch zwischen dem politischen Versprechen und der Realität in den Häusern klafft eine Lücke. Der Beitrag ordnet ein, wo KI tatsächlich helfen kann, welche Voraussetzungen dafür fehlen und warum die größte Gefahr nicht in der Technologie selbst liegt, sondern in überzogenen Erwartungen an sie.
Die Reform verlangt, was die meisten Häuser nicht leisten können
Seit dem 1. Januar 2025 ist das Krankenhausversorgungsverbesserungsgesetz in Kraft, der tiefgreifendste Umbau der Krankenhausfinanzierung seit Einführung der Fallpauschalen.1) Was auf dem Papier nach Modernisierung klingt, bedeutet für die Häuser zunächst eines: erheblich mehr Daten, die erhoben, dokumentiert und nachgewiesen werden müssen. Jeder behandelte Fall muss künftig einer von 61 Leistungsgruppen zugeordnet werden. Von dieser Zuordnung hängt unmittelbar ab, wie viel Geld ein Krankenhaus über die Vorhaltevergütung erhält. Fehlerhafte Kodierung schlägt sich also direkt in den Erlösen nieder.
Hinzu kommt ein neuer Qualitätsnachweis, der es in sich hat. Für jede Leistungsgruppe müssen Krankenhäuser belegen, dass sie über genügend Fachärzte verfügen, dass die Rufbereitschaft steht, dass die technische Ausstattung stimmt. Der Medizinische Dienst prüft, erstmals bis Mitte 2026. Das alles geschieht in einer Situation, in der Ärzte bereits heute ein Viertel ihrer Arbeitszeit mit Dokumentation verbringen.2) Die Reform fordert also mehr Daten von Menschen, die schon jetzt zu viel Zeit am Bildschirm und zu wenig am Patienten verbringen.3) In dieser Lage liegt es nahe, auf künstliche Intelligenz zu setzen. Doch wie realistisch ist das?
Wo KI heute tatsächlich funktioniert
Die Antwort darauf hängt davon ab, worüber man spricht. KI ist kein einheitliches Werkzeug, und die Evidenz für ihren Nutzen ist überraschend ungleich verteilt. Am weitesten fortgeschritten ist der Einsatz in der Verwaltung. Softwaresysteme, die Arztbriefe und OP-Berichte automatisch nach kodierrelevanten Informationen durchsuchen und passende Abrechnungscodes vorschlagen, sind in mehreren Hundert deutschen Krankenhäusern bereits im Einsatz. Sprachbasierte Dokumentationshilfen, die ärztliche Diktate in strukturierte Texte umwandeln, werden ebenfalls erprobt. Diese Systeme adressieren genau das, was die Reform verlangt: schnellere, präzisere Dokumentation bei geringerem Personalaufwand. Im internationalen Vergleich ordnen maschinelle Lernverfahren Krankenhausfälle bereits mit hoher Genauigkeit den richtigen Abrechnungsgruppen zu.4)
Auch in der Bildgebung hat KI mittlerweile eine solide Grundlage. Die bislang größte randomisierte Studie zum Thema, mit über 105.000 Teilnehmerinnen, zeigte, dass KI-gestützte Mammographie deutlich mehr Tumore erkennt als das herkömmliche Verfahren, und das bei fast halbiertem Befundungsaufwand.5) Bei Knochenbrüchen liefert KI ebenfalls zuverlässige Ergebnisse.6) Für Krankenhäuser, die ohnehin über digitale Bildgebungsketten verfügen, sind das realistische Einsatzszenarien, nicht Zukunftsmusik.
Jenseits dieser Bereiche wird es dünner. Generative Sprachmodelle, die derzeit so viel Aufmerksamkeit erhalten, schneiden in der klinischen Diagnostik schlecht ab, in einer großen Metaanalyse lag ihre Trefferquote bei nur gut der Hälfte aller Fälle.7) Für Therapieempfehlungen oder personalisierte Behandlungspläne fehlt belastbare Evidenz weitgehend. Wer KI als Allheilmittel für den Fachkräftemangel oder die Unterfinanzierung der Krankenhäuser darstellt, weckt Erwartungen, die die Technologie zum jetzigen Zeitpunkt nicht einlösen kann.
Warnendes Beispiel: Wenn KI versagt
Wie gefährlich voreiliger Einsatz sein kann, zeigt ein Beispiel aus den USA. Ein kommerzielles Sepsisfrühwarnsystem, das an Hunderten von Kliniken eingesetzt wurde und dort das Vertrauen des Personals genoss, übersah bei einer unabhängigen Überprüfung zwei Drittel aller Sepsisfälle.8) Das System hatte in den internen Tests des Herstellers gut abgeschnitten, unter realen Bedingungen und mit anderen Patientenpopulationen versagte es. Dieses Beispiel führt zu einer Erkenntnis, die für deutsche Krankenhäuser zentral ist: KI-Systeme müssen unabhängig und vor Ort validiert werden, bevor sie in die Patientenversorgung eingehen. Eine Herstellerzertifizierung allein reicht nicht aus. Die deutsche KI@work-Studie bestätigt: Qualität, Transparenz und regelmäßige Validierung sind die Grundvoraussetzungen, ohne die klinische KI nicht verantwortbar ist.9)
Dazu kommt ein strukturelles Problem, das selten diskutiert wird: Algorithmische Verzerrungen. Eine in der Fachwelt vielbeachtete Studie wies nach, dass ein in den USA weit verbreiteter Algorithmus die Versorgungsbedürfnisse von Schwarzen Patienten systematisch unterschätzte.10) Das ist kein Einzelfall. Die Hälfte aller KI-Studien im Gesundheitswesen weist ein hohes Verzerrungsrisiko auf.11) Für den deutschen Kontext bedeutet das: Jedes System, das in die Patientenversorgung eingreift, muss nicht nur technisch funktionieren, sondern auch auf seine Fairness hin überprüft werden.
Ein regulatorisches Labyrinth
Wer als Krankenhaus KI einsetzen möchte, muss sich durch ein regulatorisches Umfeld arbeiten, das seinesgleichen sucht. Drei europäische Regelwerke greifen gleichzeitig: der EU AI Act, die Medizinprodukteverordnung und die Datenschutz-Grundverordnung.12) In Deutschland kommen das Bundesdatenschutzgesetz, 16 Landesdatenschutzgesetze und die jeweiligen Landeskrankenhausgesetze hinzu. Jedes dieser Regelwerke stellt eigene Anforderungen, und nicht immer sind sie widerspruchsfrei.
Konkret bedeutet das: Medizinische KI wird nach dem EU AI Act überwiegend als Hochrisiko-System eingestuft. Krankenhäuser müssen geschultes Personal für die Aufsicht abstellen, Systemprotokolle mindestens sechs Monate aufbewahren und schwerwiegende Vorfälle melden. Bei Verstößen drohen Bußgelder von bis zu 35 Mio. €. Die Medizinprodukteverordnung verlangt zusätzlich eine Zertifizierung durch sogenannte Benannte Stellen, deren Kapazitäten ohnehin knapp sind. Immerhin erlaubt eine neue Leitlinie, beide Prüfverfahren zusammenzulegen.13) Für große Universitätskliniken mit eigenen Rechtsabteilungen ist dieses Regelwerk zu bewältigen. Für ein Krankenhaus der Grund- und Regelversorgung, das bereits mit der Umsetzung der Telematikinfrastruktur kämpft, dürfte es zur Barriere werden.
Besondere Aufmerksamkeit verdient eine Pflicht, die bereits seit Februar 2025 gilt und vielen Krankenhausleitungen noch nicht bewusst sein dürfte: die sogenannte AI-Literacy-Pflicht. Jedes Krankenhaus, das KI-Systeme einsetzt, muss sicherstellen, dass sein Personal über ausreichende KI-Kompetenz verfügt. Was genau darunter zu verstehen ist und wie der Nachweis geführt werden soll, ist bislang nicht abschließend geklärt, die Pflicht besteht gleichwohl.
Die eigentliche Hürde: Geld und Grundlagen
Doch selbst wenn Regulierung und Evidenz gelöst wären, an der Finanzierungsrealität scheitert vieles, bevor es beginnt. Drei von vier deutschen Krankenhäusern sind heute nicht investitionsfähig. Der kumulierte Investitionsstau beträgt mindestens 30 Mrd. €. Der Krankenhauszukunftsfonds stellte zwar 4,3 Mrd. € für Digitalisierung bereit, doch zwei Drittel der Häuser hielten nicht einmal die Umsetzungsfristen ein. Und eine nachhaltige Betriebskostenfinanzierung für die einmal angeschafften Systeme fehlt bis heute.
Die Zahlen des DigitalRadar machen die Dimension deutlich: Im Durchschnitt erreichen deutsche Krankenhäuser 42 von 100 Punkten bei der digitalen Reife. Grundversorger liegen noch darunter.14) Viele Häuser ringen noch mit der elektronischen Dokumentation, mit Patientenportalen, mit der Interoperabilität ihrer Systeme. Wer über KI im Krankenhaus spricht, muss anerkennen, dass ein erheblicher Teil der Häuser noch nicht die digitale Grundinfrastruktur besitzt, auf der KI überhaupt aufsetzen könnte.
Bezeichnend ist auch die Lage bei der Personalqualifikation. Die SmartHospital.NRW-Studie stellte fest, dass digitale Kompetenzen in den Curricula der Gesundheitsberufe nicht ausreichend abgebildet sind.15) Selbst nach der Reform des Pflegeberufegesetzes bleibt die Vermittlung digitaler Kompetenzen in der Ausbildung minimal. Ohne Personal, das KI-Ergebnisse kritisch einordnen kann, ist jede Technologie-Investition vergeblich. Eine Software, der niemand traut oder die niemand versteht, wird nicht genutzt, oder schlimmer: unkritisch übernommen.
Schatten-KI: Das unterschätzte Risiko
Während die offizielle KI-Einführung an Regulierung und Finanzierung scheitert, nutzt das Klinikpersonal längst inoffizielle Wege. Die DKG warnt in ihrem KI-Positionspapier vom Oktober 2025 ausdrücklich vor sogenannter Schatten-KI: Mitarbeitende, die frei verfügbare Sprachmodelle wie ChatGPT für Arztbriefe, Befundtexte oder die Vorbereitung klinischer Dokumentation nutzen.16) Was auf den ersten Blick wie pragmatische Selbsthilfe aussieht, ist rechtlich hoch problematisch. Wer Patientendaten in ein externes System eingibt, verstößt gegen die Schweigepflicht und die Datenschutz-Grundverordnung. Die Haftung kann bis zur Krankenhausleitung durchschlagen.
Das Schatten-KI-Problem zeigt ein Grunddilemma: Die Beschäftigten spüren den Dokumentationsdruck und suchen nach Lösungen. Dass sie dabei zu unregulierten Werkzeugen greifen, ist weniger ein Zeichen mangelnden Problembewusstseins als ein Symptom fehlender Alternativen. Die DKG fordert in ihrem Papier zudem, dass die ärztliche Therapiehoheit geschützt bleiben muss: Ärzte dürfen sich nicht unter Rechtfertigungsdruck gesetzt fühlen, wenn sie einer KI-Empfehlung nicht folgen. Das ist eine wichtige Grenzziehung, die in der Euphorie um die Technologie leicht untergeht.
Was andere Länder anders machen
Der Blick ins Ausland zeigt, dass es nicht an der Technologie mangelt, sondern an den Rahmenbedingungen. In England setzt die Hälfte der NHS-Krankenhäuser KI in der Diagnostik ein, in Dänemark läuft nahezu die gesamte Gesundheitskommunikation digital.17) Entscheidend war in beiden Fällen nicht ein einzelnes Förderprogramm, sondern eine institutionelle Koordination und eine digitale Grundinfrastruktur, auf der KI aufbauen konnte. Der NHS richtete dafür eigens ein KI-Labor ein, das die Einführung zentral koordinierte und begleitete. Ein solches Pendant fehlt in Deutschland.
Der Sachverständigenrat Gesundheit formulierte es bereits 2021 deutlich: Leben und Gesundheit von Menschen in Deutschland könnten besser geschützt werden, wenn die Möglichkeiten der Digitalisierung endlich verantwortlich genutzt würden.18) An dieser Einschätzung hat sich seither wenig geändert. Die aktualisierte Digitalisierungsstrategie des Gesundheitsministeriums setzt das Ziel, KI-gestützte Dokumentation bis 2028 in über 70 Prozent der Einrichtungen zum Standard zu machen.19) Gemessen am heutigen Stand ist das ambitioniert.
Realistisch betrachtet liegen die Implementierungszeiträume für klinische KI in durchschnittlichen deutschen Krankenhäusern bei fünf bis zehn Jahren, für administrative Anwendungen bei zwei bis vier Jahren. Die entscheidende Frage der kommenden Jahre wird sein, ob der Transformationsfonds von bis zu 50 Mrd. € genutzt wird, um eine kohärente Digitalisierungsstrategie zu finanzieren, oder ob die Mittel, wie beim Krankenhauszukunftsfonds teilweise geschehen, in Einzelprojekte fließen, die nach dem Ende der Förderung nicht weiterbetrieben werden können. Künstliche Intelligenz ist für die Krankenhausreform eine echte Chance. Aber sie ist eine Chance, die Voraussetzungen hat. Und für Häuser, die diese Voraussetzungen heute nicht erfüllen können, bleibt sie vorerst vor allem eines: eine weitere Anforderung auf einer ohnehin langen Liste.
Anmerkungen
1) Krankenhausversorgungsverbesserungsgesetz (KHVVG), in Kraft getreten am 1. Januar 2025. Bundesgesetzblatt 2024, Teil I, Nr. 402. Anpassungen durch das Krankenhausreformanpassungsgesetz (KHAG) www.bundesgesundheitsministerium.de/service/gesetze-und-verordnungen/detail/krankenhausversorgungsverbesserungsgesetz-khvvg.
2) Tran, B., Lenhart, A., Ross, R., et al. Burnout and EHR Use Among Academic Primary Care Physicians With Varied Clinical Workloads. JAMA Network Open 2019; 2: e1913869. doi:10.1001/jamanetworkopen.2019.13869.
3) Shanafelt, TD., Dyrbye, LN., Sinsky, C., et al. Relationship Between Clerical Burden and Characteristics of the Electronic Environment With Physician Burnout and Professional Satisfaction. Mayo Clin Proc 2016; 91: 836–848. doi:10.1016/j.mayocp.2016.05.007.
4) Xiao, C., Choi, E., Sun, J. Opportunities and challenges in developing deep learning models using electronic health records. npj Digital Medicine 2018; 1: 18. doi:10.1038/s41746-018-0029-1.
5) Lång, K., Josefsson, V., Larsson, AM., et al. Artificial intelligence-supported screen reading versus standard double reading in the Mammography Screening with Artificial Intelligence trial (MASAI): a clinical safety analysis of a randomised, controlled, non-inferiority, single-blinded, screening accuracy study. Lancet Oncol 2023; 24: 936–944. doi:10.1016/S1470-2045(23)00298-X.
6) Defined, S., et al. Diagnostic accuracy of artificial intelligence for fracture detection: a systematic review and meta-analysis. Clinical Radiology 2024; 79: e723–e735. doi:10.1016/j.crad.2024.01.026.
7) Bao, Y., Gao, Y., Zhang, J., et al. Diagnostic Accuracy of Generative AI in Medicine: A Systematic Review and Meta-Analysis. npj Digital Medicine 2025. doi:10.1038/s41746-025-01463-2.
8) Wong, A., Otles, E., Donnelly, JP., et al. External Validation of a Widely Implemented Proprietary Sepsis Prediction Model in Hospitalized Patients. JAMA Intern Med 2021; 181: 1065–1070. doi:10.1001/jamainternmed.2021.2626.
9) Sardar, P., et al. KI@work – Determinanten für eine erfolgreiche KI-Implementierung im Gesundheitswesen. J Med Internet Res (JMIR) 2025. Universität Duisburg-Essen.
10) Obermeyer, Z., Powers, B., Vogeli, C., et al. Dissecting racial bias in an algorithm used to manage the health of populations. Science 2019; 366: 447–453. doi:10.1126/science.aax2342.
11) Nagendran, M., Chen, Y., Lovejoy, CA., et al. Artificial intelligence versus clinicians: systematic review of design, reporting standards, and claims of deep learning studies. BMJ 2020; 368: m689. doi:10.1136/bmj.m689.
12) Verordnung (EU) 2024/1689 des Europäischen Parlaments und des Rates vom 13. Juni 2024 zur Festlegung harmonisierter Vorschriften für künstliche Intelligenz (EU AI Act). Amtsblatt der Europäischen Union L 2024/1689. In Kraft seit 1. August 2024.
13) Medical Device Coordination Group. MDCG 2025-6: Guidance on the interplay between the MDR/IVDR and the AI Act. Juni 2025. health.ec.europa.eu/medical-devices-sector/new-regulations/guidance-mdcg-endorsed-documents-and-other-guidance_en.
14) DigitalRadar. Zweite Erhebungswelle 2024: Digitaler Reifegrad deutscher Krankenhäuser. Durchschnittswert 42,4 von 100 Punkten (2021: 33,3). www.digitalradar-krankenhaus.de/pressemitteilung-zur-auswertung-der-ersten-ergebnisse-der-zweiten-datenerhebung-9-januar-2025/.
15) Thiel, R., et al. SmartHospital.NRW: Kompetenzanforderungen für das digital vernetzte Krankenhaus. BMC Med Educ 2024. doi:10.1186/s12909-024-05113-7.
16) Deutsche Krankenhausgesellschaft. Positionspapier zu Künstlicher Intelligenz. Veröffentlicht am 23. Oktober 2025. www.dkgev.de/fileadmin/default/Mediapool/1_DKG/1.3_Politik/Positionen/2025-10-23_DKG-Positionspapier_KI_im_Krankenhaus.pdf.
17) NHS England. AI Diagnostic Fund und NHS AI Lab. transform.england.nhs.uk/ai-lab/. Ergänzend: Sundhedsdatastyrelsen (Danish Health Data Authority). Digital Health Strategy Denmark.
18) Sachverständigenrat zur Begutachtung der Entwicklung im Gesundheitswesen. Gutachten 2021: Digitalisierung für Gesundheit – Ziele und Rahmenbedingungen eines dynamisch lernenden Gesundheitssystems. www.svr-gesundheit.de/fileadmin/Gutachten/Gutachten_2021/SVR_Gutachten_2021.pdf.
19) Bundesministerium für Gesundheit. Digitalisierungsstrategie „GEMEINSAM DIGITAL“, aktualisiert Februar 2026. www.bundesgesundheitsministerium.de/themen/digitalisierung.
Anschrift der Verfasserin
Michelle Gresbek, M. Sc., angehende Doktorandin Charité Universitätsmedizin. Kontakt: michelle.gresbek@gmail.com