AI Dubbing: Wem gehört die Stimme?

6 min

AI Dubbing verspricht schnellere Sprachfassungen, weniger Produktionsaufwand und mehr Skalierbarkeit. Rechtlich ist das Thema aber komplex, weil es verschiedene Fragen verschränkt: Recht an der Stimme, Datenschutz, vertragliche Ausgestaltung und Transparenzpflichten greifen ineinander. Wer KI-Einsatz zu pauschal behandelt, riskiert Lücken in der Rechtekette – und damit teure Konflikte.

Unverbindliches Erstgespräch vereinbaren

Was ist AI Dubbing überhaupt?

AI-Dubbing bezeichnet KI-gestützte Verfahren, bei denen vorhandene Sprachaufnahmen als Input verarbeitet werden, um neue Sprachfassungen, synthetisch erzeugte Stimmen oder Varianten zu erzeugen. Vereinfacht: Die Aufnahme wird nicht nur geschnitten oder gemischt, sondern kann in einen KI-Prozess einfließen, der aus derselben Performance weitere Versionen ableitet – bis hin zur Nutzung einer Stimmreplik für automatisierte Ausgaben.

AI-Dubbing bezeichnet KI-gestützte Verfahren, bei denen vorhandene Sprachaufnahmen als Input verarbeitet werden, um neue Sprachfassungen, synthetisch erzeugte Stimmen oder Varianten zu erzeugen. Vereinfacht: Die Aufnahme wird nicht nur geschnitten oder gemischt, sondern kann in einen KI-Prozess einfließen, der aus derselben Performance weitere Versionen ableitet – bis hin zur Nutzung einer Stimmreplik für automatisierte Ausgaben.

Warum AI Dubbing gerade jetzt rechtlich brisant ist

Die Debatte wird derzeit durch den öffentlich diskutierten Konflikt zwischen Netflix und deutschen Synchronsprechern und Synchronsprecherinnen bestimmt. Der Fall zeigt, worum es in der Praxis geht: um die Reichweite und Bestimmtheit von Verträgen und Einwilligungen – insbesondere darum, ob Sprachaufnahmen über die werkbezogene Synchronisation hinaus auch als Input für KI-Verfahren genutzt werden dürfen.

Genau darin liegt die Brisanz. Wer eine Stimme ursprünglich für eine klassische Synchronleistung freigegeben hat, hat damit nicht automatisch auch jeder späteren KI-Nutzung zugestimmt. Vor allem dann nicht, wenn aus der Aufnahme neue synthetische Outputs entstehen, die über die ursprüngliche Produktion hinausgehen.

Die Stimme ist vom Allgemeinen Persönlichkeitsrecht erfasst; Sprachaufnahmen sind zudem regelmäßig personenbezogene Daten. Entscheidend ist daher nicht, was technisch möglich ist, sondern ob Einwilligung und Rechtekette die konkrete KI-Nutzung tatsächlich abdecken.

Wichtig sind insbesondere diese Ebenen:

  • die ursprüngliche Aufnahme,
  • die Nutzung als Input,
  • synthetische oder sonst abgeleitete Outputs,
  • Weiterverwendung und kommerzielle Verwertung.

Newsletter

Für Ihre Inbox

Wichtiges zu Datenschutz, KI, IT-Recht und vielen mehr – einmal monatlich in Ihr Postfach.

Was ist die Summe aus 4 und 6?

Mit Klick auf den Button stimmen Sie dem Versand unseres Newsletters und der aggregierten Nutzungsanalyse (Öffnungsrate und Linkklicks) zu. Sie können Ihre Einwilligung jederzeit widerrufen, z.B. über den Abmeldelink im Newsletter. Mehr Informationen: Datenschutzerklärung.

Warum Standardklauseln häufig nicht ausreichen

Viele Synchron- und Produktionsverträge sind auf klassische Bearbeitungsschritte der Postproduktion zugeschnitten. Für AI-Dubbing reicht das oft nicht: Bereits die Input-Nutzung einer Sprachaufnahme in KI-Verfahren kann eine eigenständige, zustimmungspflichtige Nutzungsform sein. Entscheidend sind zudem die abgeleiteten Ergebnisse und ihre Verwertung.

Für die Praxis heißt das:

  • Scope: Deckt die Einwilligung KI-Input-Nutzung und Outputs ausdrücklich ab?
  • Kontrolle: Gibt es Schutzklauseln für neue Aussagen oder kontextwidrige Nutzungen?
  • Auswertung: Sind Ausgaben, Medien, Dauer und Übertragbarkeit sowie Sub-Lizenzierung geregelt?

Entscheidend ist die Trennung zwischen Input und Output

Eine praktische Leitlinie für die Vertragsprüfung ist dabei die Trennung zwischen Input und Output. Sie hilft, KI-Klauseln in zwei prüfbare Fragen zu teilen.

Erstens, ob die Sprachaufnahme überhaupt als Input in KI-Verfahren genutzt werden darf.

Zweitens, ob und in welchem Umfang die daraus entstehenden Outputs verwertet werden dürfen.

Viele Regelungen sind werkbezogen formuliert und sagen wenig darüber, ob abgeleitete Ergebnisse später weitergenutzt, skaliert oder in neue Kontexte übertragen werden dürfen.

Datenschutz ist eine eigene Prüfschiene

Neben dem Persönlichkeitsrecht ist die datenschutzrechtliche Zulässigkeit eigenständig zu prüfen. Eine vertragliche Rechteübertragung oder Einwilligung für das Werk ersetzt keine DSGVO-Rechtsgrundlage für die Verarbeitung.

Sprachaufnahmen sind regelmäßig personenbezogene Daten. Damit stellen sich die üblichen DSGVO-Fragen:

  • wer verarbeitet in welcher Rolle
  • auf welcher Rechtsgrundlage
  • für welchen Zweck
  • wie lange wird gespeichert und
  • ob Weitergaben oder spätere Zweckänderungen (insbesondere bei KI-Training/Reuse) abgedeckt sind.

Für Unternehmen bedeutet das:

  • Vertragsfreigabe und Datenschutzfreigabe sind nicht dasselbe.
  • Die Verarbeitung muss auf einen klar definierten Zweck gestützt sein.
  • Speicherfristen, Weitergaben und Zweckänderungen müssen frühzeitig mitgedacht werden.

Schutzklauseln machen oft den Unterschied

Schutzklauseln werden durch den Einsatz von künstlicher Intelligenz wichtig, weil künstlich erzeugte Sprachfassungen die Stimme aus der ursprünglich kontrollierten Verwendung in neue Aussagen und neue Kontexte verschieben können. Ohne klare Grenzen wird die vertragliche Erlaubnis faktisch grenzenlos. Das Risiko der Bedeutungs- und Kontextverschiebung liegt in Reputationsschäden, Irreführung oder eine Zuordnung einer Aussage zu einer Person, die sie nicht selbst getätigt hat.

Sinnvolle Schutzmechanismen sind:

  • Kontextverbote für bestimmte Einsatzfelder
  • Freigabeprozesse für neue Nutzungsszenarien
  • Sonderregeln für synthetische oder digital nachgebildete Stimmen
  • gesonderte Freigaben für Werbung, sensible Themen und projektfremde Zweitverwertungen

Das größte Risiko entsteht oft beim Output

Besonders riskant ist die kommerzielle Nutzung synthetisch nachgebildeter Stimmen, wenn die Ausgabe einer bestimmten Person zugeordnet wird. Dann steht nicht nur eine unzulässige Verwertung der ursprünglichen Aufnahme im Raum, sondern die Nutzung eines persönlichkeitsrechtlich geschützten Merkmals mit eigenem wirtschaftlichem Wert.

Das LG Berlin II (LG Berlin II, Urt. v. 20.08.2025 – 2 O 202/24**)** hat klargestellt, dass ein Eingriff auch dann vorliegen kann, wenn nicht die Originalstimme verwendet wird, sondern eine durch künstliche Intelligenz erzeugte Nachahmung, und dass die Grundsätze zur wirtschaftlichen Verwertung aus der unberechtigten Bildnisnutzung auf die Stimme übertragbar sind.

Rechtsfolgen, die daraus typischerweise drohen:

  • Unterlassungsansprüche und Beseitigung
  • Auskunfts- und Rechnungslegungsansprüche zur Nutzungsaufklärung
  • Zahlungsansprüche nach Lizenzanalogie oder als Schadensersatz
  • Streit über Umfang und Reichweite vertraglicher Rechte und deren wirtschaftliche Abgeltung

Auch Vergütung und Governance müssen mitgedacht werden

AI Dubbing verändert nicht nur die Art der Nutzung, sondern auch ihren wirtschaftlichen Wert. Wenn aus einer einmaligen Aufnahmeleistung zahlreiche weitere Nutzungen entstehen, stellt sich die Frage, ob die ursprüngliche Vergütung noch zur tatsächlichen Verwertung passt.

Ebenso wichtig ist die interne Governance. Selbst gute Verträge helfen nur begrenzt, wenn im Unternehmen unklar bleibt, wer KI-Nutzungen freigibt, Outputs prüft, Re-Use genehmigt und die tatsächliche Nutzung dokumentiert.

Gerade bei internationalen Sprachfassungen und externen Technologiepartnern braucht es deshalb klare Zuständigkeiten, definierte Prüfpfade und nachvollziehbare Dokumentation.

Ab August 2026 kommt eine weitere Compliance-Ebene hinzu

Für KI-generierte oder KI-manipulierte Audioinhalte kann ab dem 2. August 2026 eine Transparenzpflicht nach der KI-Verordnung relevant werden – insbesondere dann, wenn der Inhalt einen Deepfake darstellt.

Damit wird AI Dubbing zusätzlich zu einem Transparenz- und Kennzeichnungsthema. Unternehmen sollten das Thema deshalb nicht isoliert betrachten, sondern als Zusammenspiel aus Vertragsgestaltung, Persönlichkeitsrecht, Datenschutz, Freigabeprozessen und Transparenzpflichten.

Fazit: AI Dubbing braucht klare Regeln, bevor es skaliert

Die eigentliche Herausforderung beim AI Dubbing liegt nicht allein in der Technik, sondern in einer sauberen Rechte- und Freigabestruktur. Klassische Vertragsmuster bilden KI-spezifische Nutzungen von Stimmen häufig nicht verlässlich ab – vor allem bei Input-Nutzung, synthetischen Outputs, Weiterverwertung und Vergütung.

Die wichtigste Erkenntnis lautet deshalb: Wer AI Dubbing rechtssicher einsetzen will, sollte KI-spezifische Releases ausdrücklich regeln, Schutzklauseln präzise formulieren, die datenschutzrechtliche Zweckbestimmung mitdenken und belastbare Governance-Prozesse etablieren.

Der praktische Schluss daraus ist klar: Unternehmen sollten bestehende Vertragsmuster, Release-Prozesse und interne Zuständigkeiten frühzeitig überprüfen, bevor AI Dubbing in größerem Umfang eingesetzt oder international ausgerollt wird.

Erstgespräch kostenlos

In 30 Minuten zu klaren Prioritäten in der KI-Compliance

Erstgespräch vereinbaren

Sie sagen uns, was Sie vorhaben – wir sagen Ihnen klar, was möglich ist.

Philipp Müller-Peltzer
Rechtsanwalt, Partner | Berlin