Publiziert am 19.06.2025

Forscher der Technischen Universität Darmstadt (TU Darmstadt), der University of Cambridge und der University of Texas at San Antonio haben Bildschutzwerkzeuge wie «Glaze» und «NightShade» mittels «LightShed» überlistet. Die Tools garantieren Künstlern eigentlich, ihre Werke vor KI-Trainingseinheiten zu bewahren.

Beide überrumpelten Tools arbeiten mit subtilen, für das menschliche Auge unsichtbaren Verzerrungen, sogenannten «poisoning perturbations», die in digitale Bilder eingebettet werden, um KI-Modelle beim Training gezielt zu stören.

Glaze hat einen passiven Ansatz, der es dem Modell erschwert, stilistische Merkmale korrekt zu extrahieren. NightShade sabotiert den Lernprozess aktiv, indem es das Modell dazu bringt, den Stil der Künstler mit völlig anderen Konzepten zu verknüpfen.

Erfolgsquote 99,98 Prozent

Die Methode der Experten erkennt versteckte Störungen, kann sie zurückentwickeln und entfernen. Die Bilder werden so wieder nutzbar für das KI-Training. In Tests hat LightShed die durch NightShade geschützten Bilder mit einer Genauigkeit von 99,98 Prozent überlistet.

Die Forscher betonen, dass es sich bei LightShed nicht nur um einen Angriff, sondern um einen Weckruf handelt: «Wir sehen darin eine Chance, Schutzmechanismen gemeinsam weiterzuentwickeln», so Ahmad-Reza Sadeghi vom System Security Lab der TU Darmstadt. (pte/cbe)