AI & Data Regulation: datengetriebene Use Cases und KI-Projekte mithilfe von MLOps strategisch planen und umsetzen

19.09.2023

12 min

Datengetriebene KI-Projekte bieten Unternehmen Möglichkeiten zur Arbeits- und Prozessoptimierung und können einen erheblichen Mehrwert schaffen. Dabei sind jedoch stets technische und regulatorische Anforderungen zu beachten. Um diese Herausforderungen erfolgreich zu meistern, lohnt sich eine vertiefte Auseinandersetzung mit den notwendigen Projektphasen sowie den gesetzlichen Anforderungen.

Unverbindliches Erstgespräch vereinbaren

Inhalt

Je nach Use Case und spezifischen Gegebenheiten unterscheiden sich die konkreten Challenges. Um den diversen Herausforderungen zu begegnen, ist das sogenannte Machine Learning Operations (MLOps) ein geeignetes Prozesstool. Die folgenden Ausführungen sollen einen Einblick in den Aufbau und die Durchführung entsprechender datengetriebener Use Cases und KI-Projekte geben und insbesondere darstellen, wie gesetzliche Anforderungen mittels MLOps nachhaltig und innovationsfreundlich umgesetzt werden können.

KI in Unternehmen – Automatisierung und Innovationsförderung

Die Entwicklung und die Nutzung von KI ist vor allem für solche Unternehmen attraktiv, die in Bereichen mit besonders hohem Datenaufkommen tätig sind. Dazu zählen beispielsweise Versicherungen, Banken, Unternehmen aus der Energiewirtschaft oder dem Gesundheitswesen. Vornehmlich das sogenannte Deep Learning, das eine Methode des Machine Learnings ist, kann in Unternehmen gewinnbringend eingesetzt werden. Es kann als die Fähigkeit eines KI-Systems beschrieben werden, datengetriebene Entscheidungen zu treffen oder Outputs zu generieren, indem sie Muster in großen Datensätzen erkennen und extrahieren.

Die Anwendungsbereiche für KI sind dabei sehr groß. Vor allem repetitive Aufgaben können die Algorithmen übernehmen. Die Fähigkeit, große Mengen von Daten zu analysieren und zu verarbeiten, ermöglicht es KI-Systemen außerdem, etwa bei Entscheidungsfindungen zu unterstützen, Prozesse zu automatisieren und bestehende Unternehmensprodukte und -dienste innovativer zu gestalten.

Im Rahmen der Einschätzung, ob und wo im Unternehmen KI sinnvoll eingesetzt werden kann, empfiehlt sich ein KI-Reifegrad Assessment. Dieses kann als Bestandsaufnahme im Hinblick auf das „AI Maturity Level“ eines Unternehmens gesehen werden. Es gibt Aufschluss über den Status Quo in Bezug auf KI in einem Unternehmen und ermöglicht die gesamtheitliche Auseinandersetzung mit dem Thema. So kann dadurch etwa ermittelt werden, wo technische Synergien genutzt werden können und unter Umständen Ressourcen fehlen und benötigt werden.

Herausforderungen bei der Implementierung von KI

Die erfolgreiche Entwicklung und Inbetriebnahme von KI stellt Unternehmen vor eine Reihe von Herausforderungen technisch-organisatorischer und rechtlicher Natur. Als Folge wird ein großer Teil der KI-Systeme, die in Unternehmen entwickelt werden, nie in den Produktivbetrieb überführt. Dies liegt an Komplexitäten, die dem gesamten Lebenszyklus eines Machine Learning KI-Systems innewohnen, der aus vielen verschiedenen Phasen besteht, in die unterschiedliche Stakeholder eingebunden sind. Zu den Phasen zählen etwa die der Datenerfassung, der Datenaufarbeitung, der Modellierung und des Trainings, der Validierung, der Optimierung, der Überwachung, etc. Involvierte Akteure sind beispielsweise Data Scientists, Data Engineers oder Machine Learning Engineers. All diese Prozesse und Beteiligten zu koordinieren und synchronisieren ist eine Aufgabe, an der der Erfolg eines KI-Systems scheitern kann.

Hinzu kommen vielfältige rechtliche Anforderungen, die bei der Entwicklung und im Betrieb eines KI-Systems beachtet werden müssen. Soweit im Rahmen eines KI-Projektes personenbezogene Daten verarbeitet werden, zählen dazu die Vorgaben aus der DSGVO. Unter anderem müssen betroffene Personen bei einer Datenerhebung gem. Art. 13 Abs. 2 lit. f bzw. Art. 14 Abs. 2 lit. g DSGVO über die involvierte Logik einer automatisierten Entscheidungsfindung sowie die Tragweite und die angestrebten Auswirkungen einer derartigen Verarbeitung informiert werden.

Zusätzlich wird im Rahmen der Compliance-konformen KI-Entwicklung zukünftig auch die kommende KI-Verordnung (KI-VO) zu berücksichtigen sein. Die Verordnung wird derzeit von den gesetzgebenden Organen der EU ausgearbeitet und soll einen harmonisierten Rechtsrahmen für die Entwicklung und den Einsatz von KI in der gesamten Union schaffen. Sektorenübergreifend sieht das Gesetz Regelungen vor, die den gesamten Lebenszyklus eines KI-Systems betreffen. Der Umfang der Anforderungen hängt dabei von dem Risiko ab, das von einer KI ausgeht. Beispielsweise sieht der Entwurf zur KI-VO vor, dass Entwickler von KI mit hohem Risiko (Hochrisiko-KI), eine technische Dokumentation erstellen, aus der, ähnlich wie es die DSGVO vorsieht, hervorgeht, wie das System entwickelt wurde und wie es während seines Lebenszyklus funktioniert. Erforderlich ist also, allgemeine Merkmale, Fähigkeiten und Grenzen eines Systems, die verwendeten Algorithmen, Daten, Trainings-, Test- und Validierungsverfahren zu dokumentieren. Außerdem zählen zu den Anforderungen, die die KI-VO an Entwickler von Hochrisiko-KI stellen wird, das Einrichten eines Risikomanagement-Systems, Datengovernance-Verfahren und Vorgaben für die Qualität von Trainings-, Validierungs- und Testdatensätze, Aufzeichnungspflichten, Transparenzpflichten, die Pflicht zur menschlichen Aufsicht, sowie Bestimmungen hinsichtlich Genauigkeit, Robustheit und Cybersicherheit der KI-Systeme. Zu beachten ist dabei, dass der Begriff der Hochrisiko-KI recht weit zu verstehen ist. Beispielsweise zählen nach derzeitigem Stand KI-Systeme dazu, die als Sicherheitskomponenten in der Wasser-, Gas- und Stromversorgung verwendet werden, KI, die in der Personalverwaltung bei der Auswahl, Einstellung, Beförderung oder Kündigung von Mitarbeiter:innen genutzt wird und KI die bei der Entscheidung, ob eine Kranken- oder Lebensversicherung zustande kommt, involviert ist. Auch wenn sich die KI-VO noch in der Verhandlung befindet, sind die kommenden Regelungen in ihren Grundzügen bereits abzusehen und Unternehmen sollten sich aufgrund deren Komplexität und Vielschichtigkeit bereits jetzt darauf vorbereiten.

Abhängig von den Use Cases können zudem verschiedene andere, oftmals branchenspezifische, Gesetze zu berücksichtigen sein. Um Redundanzen zu vermeiden und rechtliche Vorgaben effizient umzusetzen, sollten möglichst Synergieeffekte identifiziert und genutzt werden.

Newsletter

Für Ihre Inbox

Wichtiges zu Datenschutz, KI, IT-Recht und vielen mehr – einmal monatlich in Ihr Postfach.

KI-Lebenszyklusverwaltung durch MachineLearningOperations

Die vielfältigen Hürden, die es für die erfolgreiche Implementierung von KI zu bewältigen gilt, lassen sich effektiv mithilfe von MachineLearningOperations abbilden und bewältigen. Es handelt sich dabei um ein technisch-organisatorisches Tool, welches in einem interdisziplinären Ansatz unterschiedliche Stakeholder zusammenbringt, um Machine-Learning-KI effizienter zu entwickeln und ihre Implementierung zu überwachen. Dabei wird auf Prinzipien des Development and Operations (DevOps) zurückgegriffen und diese auf die Besonderheiten des Machine Learning Lifecycles übertragen, um so die Entwicklung, Bereitstellung und Wartung von KI-Modellen zu optimieren. Im Vordergrund steht dabei die Automatisierung von Prozessen, um eine schnellere Markteinführung zu ermöglichen und zu verhindern, dass es nie zum Produktivbetrieb einer KI kommt. Zudem fördern cross-funktionale Teams die Synergie und Effizienz der KI-Projekte. Durch konstantes Monitoring und Feedback-Schleifen können Probleme schnell identifiziert und behoben werden. Zudem können die gesetzlichen Anforderungen durch integrierte Compliance-Prozesse in den verschiedenen Projektphasen allen Beteiligten kommuniziert werden.

Aufgrund der großen Vielfalt an möglichen Use Cases und den variierenden KI-Reifegraden von Unternehmen, lässt sich die Realisierung von KI-Projekten auch mithilfe von MLOps nicht pauschalisieren. Grundsätzlich muss jedes Projekt individuell und den jeweiligen Umständen entsprechend geplant werden. Dabei durchläuft es in der Regel eine Vielzahl von Phasen, die unterschiedlich gewichtet werden. Dennoch lassen sich MLOps-Prozesse in einen iterativen MLOps-Kreislauf einteilen, der im Wesentlichen vier immer wiederkehrende Prozessschritte umfasst. Die Phasen der Entwicklung, der Validierung, des Deployments und des Monitorings von KI-Anwendungen. Die folgenden Ausführungen sollen einen Überblick über die Herausforderungen in den jeweiligen Projektphasen geben. Der Fokus liegt dabei auf der Entwicklungsphase und insbesondere auf den Anforderungen bezüglich der verwendeten Daten.

Entwicklung

Stakeholder in der KI-Entwicklung

Am Anfang der erfolgreichen KI-Entwicklung sollten die Rollen der involvierten Stakeholder definiert und Schlüsselfunktionen festgelegt werden. Data Engineers übernehmen die Datenbeschaffung und -bereinigung, zudem schaffen sie die Dateninfrastruktur, mit der im Anschluss gearbeitet wird. Mithilfe dessen erschaffen Data Scientists statistische Modelle, die Unternehmen helfen, aus ihren Daten Erkenntnisse zu gewinnen und Vorhersagen zu treffen und die KI-Modelle zu trainieren. Software-Engineers unterstützen dabei, die Machine-Learning-Pipelines zu optimieren. DevOps-Teams garantieren mittels Continous Integration und Deployment einen störungsfreien KI-Betrieb und sind für das Monitoring der Systeme zuständig. In jeder Projektphase sollten zudem juristische Consultants involviert sein, da in allen Schritten variierende gesetzliche Anforderungen zu beachten sind. Außerdem sieht der Entwurf zur KI-VO vor, dass ein Hochrisiko-KI-System während der gesamten Dauer seiner Verwendung menschlich beaufsichtigt werden kann. Es gilt daher entsprechenden Personen diese Aufsicht zu übertragen und unter anderem sicherzustellen, dass sie die Funktionsweise des Systems gänzlich verstehen, die Arbeitsergebnisse richtig interpretieren können und stets in der Lage sind, den Betrieb der KI mittels einer „Stopptaste“ zu unterbrechen.

Inventur und nutzerzentrierte Planung

Zu Beginn der Entwicklungsphase erfolgt zudem das Design eines KI-Modells. Im Rahmen dessen sollte zunächst eine Inventur der analogen und digitalen Verhältnisse eines Unternehmens angefertigt werden. So können Schlüsselpotenziale, Entwicklungs-Assets und auch etwaige projekthindernde Missstände identifiziert werden. Zudem sollte eine KI-Reifegradmessung mittels Data Flow Mapping vorgenommen werden, um die bestehende Datenlandschaft des Unternehmens realitätsgetreu abzubilden und zukünftige Chancen daraus korrekt ableiten zu können. Um hieraus Use Cases zu konzipieren, empfiehlt sich die Anfertigung einer „Analytical Roadmap“ aus den im Rahmen des vorstehenden Prozesses erhobenen Informationen, sowie das nachgelagerte Erstellen von Checklisten, um die notwendigen Aufgaben zur Zielerreichung zu definieren. Zudem sollte bereits in dieser Planungsphase ein iteratives, nutzerzentriertes Vorgehen vereinbart werden, da nur durch die stetige Beteiligung und den damit einhergehenden Meinungsinput der Anwender:innen praxistaugliche KI-Lösungen gefunden werden können. Strikt zu vermeiden sind finale Releases, d. h. die Auslieferung eines vermeintlich finalen Produkts zur Freigabe ohne Beteiligung der finalen Nutzer:innen oder anderer Stakeholder, wodurch entweder die Anwender:innen die KI-Lösung aufgrund mangelnden Wissens oder Überforderung nur schlecht oder gar nicht nutzen können oder es zu Compliance-Verstößen kommt, die in Mehraufwand durch die notwendige Überarbeitung des bisherigen Produkts resultieren.

Trainingsdaten und technische Hürden

Eine besonders wichtige Rolle spielen in der Entwicklungsphase die Trainingsdaten eines KI-Systems. In gewisser Weise können sie als das Fundament oder der Werkstoff des jeweiligen KI-Systems bezeichnet werden. Ihre Verarbeitung geht jedoch mit vielfältigen technischen wie auch rechtlichen Faktoren einher, die es zu berücksichtigen gilt. Auf technischer Seite stellt sich zunächst das Problem, dass viele Unternehmen gar nicht in der Lage sind, den Datenschatz zu heben, der oftmals fragmentarisch über mehrere Systeme und Server verteilt liegt. Derartige Datensilos gilt es in unternehmensweiten Datenplattformen zu konsolidieren und die Daten damit verfügbar zu machen. Etwa ein Data Lake als Single Source of Truth ermöglicht ein regelmäßiges Neu- und Nachtrainieren von KI-Modellen. Wichtig ist es, Release-Kriterien zu definieren, um im entsprechenden Zeitpunkt auf die erforderlichen Datensätze zugreifen zu können. Beim Training des KI-Systems ist zudem darauf zu achten sowohl Datenhypertrophie als auch Overfitting zu vermeiden. Das bedeutet, dass die Trainingsdatensätze weder zu groß noch zu klein sein sollten, da es andernfalls zur Funktionsunfähigkeit der KI oder zu inadäquaten Ergebnissen kommen kann.

Rechtliche Vorgaben für Trainingsdaten

Die rechtlichen Vorgaben, die im Zusammenhang mit KI-Trainingsdaten zu berücksichtigen sind, lassen sich im Rahmen eines „Regulatory Mappings“ identifizieren und zusammenfassen. Eine entscheidende Rolle bei der Umsetzung von KI-Projekten spielt fast immer die DSGVO. Denn sofern für die KI personenbezogene Daten verarbeitet werden, sind die Anforderungen der DSGVO einzuhalten. Allein durch die notwendigen Schritte der Datenbeschaffung und des Trainings der KI besteht dabei das Risiko, dass personenbezogene Daten ohne ausreichende datenschutzrechtliche Grundlage verarbeitet werden. Dies wird dadurch verschärft, dass eine Extraktion und Löschung von einmal in die KI eintrainierten Daten bislang nur schwer bis gar nicht möglich ist. Insbesondere vor dem Hintergrund der Umsetzung der Betroffenenrechte aus Art. 15 ff. DSGVO kann sich dies als problematisch erweisen. Daher sollten personenbezogene Daten, soweit möglich, bereits während der Aufbereitung der Trainingsdaten anonymisiert werden. Eine solche Aufbereitung wird im Regelfall notwendig, um die Qualität der Syntax und Semantik der Daten bezüglich ihrer Richtigkeit zu gewährleisten. Auch auf die Einhaltung der Grundsätze der Zweckbindung, Integrität und Vertraulichkeit, Datenminimierung und Richtigkeit bezüglich personenbezogener Daten aus Art. 5 DSGVO ist zu achten. Weiter empfiehlt es sich bereits während des Designs der KI automatisierte Prozesse zur Dokumentation zu schaffen und dem Privacy-by-Design-Grundsatz aus Art. 25 Abs. 1 DSGVO von Anfang an ausreichende Beachtung zu schenken. So sollten unter Zugrundelegung der späteren Anwendungsgebiete der KI im Betrieb bereits bei der Konzeption angemessene Zugriffsberechtigungen und Möglichkeiten zur Umsetzung von Betroffenenrechten geschaffen werden.

Der Entwurf zur KI-VO (KI-VO-E) sieht dezidierte Regelungen für Trainings-, sowie Test und Validierungsdatensätze vor. Nach Art. 10 Abs. 2 KI-VO-E sollten für diese geeignete Daten-Governance- und Datenverwaltungsverfahren implementiert werden. Diese Verfahren betreffen beispielsweise einschlägige konzeptionelle Entscheidungen oder die Überprüfung auf mögliche Verzerrungen. In Art. 10 Abs. 3 und 4 KI-VO werden konkrete Qualitätsanforderungen für die umfassten Datensätze vorgegeben. Danach müssen diese beispielsweise relevant, repräsentativ, fehlerfrei und vollständig sein. Da derartig absolute Kriterien in der Praxis nahezu unmöglich umzusetzen sind, wird sich im derzeit stattfindenden Trilog wahrscheinlich die flexiblere Parlamentsversion durchsetzen, nach der die Datensätze relevant, hinreichend repräsentativ und angemessen auf Fehler überprüft und im Hinblick auf den beabsichtigten Zweck so vollständig wie möglich sein müssen. Dennoch wird die Umsetzung der Regelung in der Praxis durchaus anspruchsvoll sein.

Validierung

In der Validierungsphase wird ein KI-System darauf überprüft, ob es Arbeitsergebnisse erzielt, die zum Erreichen der gesetzten Ziele geeignet sind. Es wird also sichergestellt, dass ein Modell so funktioniert wie es soll. Dabei kommen Validierungsdaten zum Einsatz, für die im Wesentlichen die gleichen Anforderungen gelten wie für Trainingsdaten.

Deployment

Im Anschluss an die Validierung wird das KI-System in den Produktivbetrieb überführt. Die KI wird also in einer realen Umgebung oder Anwendung implementiert, für die sie bestimmt wurde. Im Rahmen der Transparenzpflichten aus dem KI-VO-E ist dabei zu beachten, dass für ein Hochrisiko-System stets eine digitale Gebrauchsanleitung zur Verfügung gestellt werden muss, die präzise, vollständige, korrekte und eindeutige Informationen in einer für die Nutzer relevanten, barrierefrei zugänglichen und verständlichen Form enthält.

Monitoring

Nach der Produktivstellung gilt es ein KI-Modell in einem iterativen Prozess kontinuierlich zu überwachen. Im Rahmen dessen gilt es auch während des Betriebes eines KI-Systems zukünftig eine Reihe an Anforderungen aus der kommenden KI-VO zu beachten. Beispielsweise gilt es für Hochrisiko-KI ein Risikomanagementsystem einzurichten und während des gesamten Lebenszyklus der KI aufrechtzuerhalten. Für Systeme mit geringerem Risiko gelten beispielsweise gewisse Transparenzpflichten. Arbeitet die KI mit personenbezogenen Daten, sind auch hier die Vorgaben aus der DSGVO zu beachten.

Fazit

Die Planung und Durchführung komplexer datengetriebener KI-Projekte ist auf vielen Ebenen eine Herausforderung. Um den Projekterfolg sicherzustellen und nachhaltige Erfolge zu erzielen, sollten Unternehmen daher planvoll vorgehen und frühzeitig eine klare Projektstruktur festlegen. Dabei sollten die regulatorischen Anforderungen stets im Blick behalten werden. MLOps kann in diesem Rahmen als Management-Tool für den gesamten Lebenszyklus eines KI-Modells eine große Hilfe darstellen. Die MLOps-Methode ermöglicht die interdisziplinäre Kommunikation und Koordination im Umgang mit den vielfältigen Hürden bei der KI-Entwicklung und Inbetriebnahme. Zudem lassen sich die Systeme damit effizient skalieren und es kann sichergestellt werden, dass die erwarteten Ergebnisse geliefert werden.

Profitieren Sie von unserer Erfahrung bei der Realisierung von KI-Projekten. Gemeinsam verwandeln wir technische und regulatorische Herausforderungen in zukunftsweisende Chancen für Ihr Unternehmen. Unsere Expertinnen und Experten verhelfen Ihrem KI-Projekt zu einem langfristigen Erfolg.

Vereinbaren Sie jetzt ein Erstgespräch!

Lassen Sie uns über Ihre Herausforderungen sprechen und vereinbaren Sie ein unverbindliches Erstgespräch mit unseren spezialisierten Anwält:innen.

Termin vereinbaren

Inhalt

Ihre Ansprechpartner:innen

Kathrin Schürmann

Rechtsanwältin, Partnerin Berlin