Data Poisoning

Einleitung

In diesem aiMOOC geht es um das wichtige und zunehmend relevante Thema Data Poisoning. Dabei handelt es sich um gezielte Manipulationen von Trainingsdaten in Maschinellem Lernen und Künstlicher Intelligenz (KI), mit dem Ziel, die Modelle zu sabotieren oder unerwünschte Effekte hervorzurufen. Data Poisoning ist eine Form von Cyberangriff und kann schwerwiegende Auswirkungen auf automatisierte Systeme, wie beispielsweise in der Gesichtserkennung, bei Chatbots oder in der Medizinischen Diagnostik haben.

In diesem MOOC erfährst Du, was Data Poisoning genau ist, wie es funktioniert, welche Arten es gibt, welche Risiken damit verbunden sind und wie man sich dagegen schützen kann.

Was ist Data Poisoning?

Definition und Grundprinzip

Data Poisoning bezeichnet das absichtliche Einbringen von fehlerhaften, manipulierten oder schädlichen Daten in einen Trainingsdatensatz, um die Leistung eines Maschinellen Lernmodells zu verschlechtern oder es in eine bestimmte Richtung zu beeinflussen.

Die Idee dahinter ist ähnlich wie bei einer Vergiftung – das System wird durch scheinbar normale, aber schädliche Daten korrumpiert.

Warum ist Data Poisoning gefährlich?

Data Poisoning kann zu folgenden Konsequenzen führen:

Fehlentscheidungen in autonomen Systemen (z. B. Autos)
Manipulierte Diagnosen in medizinischer KI
Vertrauensverlust in KI-gestützte Systeme
Cyberangriffe durch gezielte Schwächung von Sicherheitsmechanismen
Diskriminierende Modelle durch gezielte Verzerrung

Arten von Data Poisoning

Es gibt mehrere Varianten von Data Poisoning:

Label Flipping: Falsche Zuordnung von Labels (z. B. Hund als Katze)
Backdoor Attack: Einfügen spezieller Merkmale, um das Modell zu kontrollieren
Availability Attack: Sabotage der Modellleistung insgesamt
Targeted Attack: Angriff auf bestimmte Ausgaben des Modells

Beispiele für Data Poisoning

In einem Spamfilter werden gezielt "harmlose" Spam-Mails eingefügt, um ihn zu verwirren.
In einer Bilddatenbank werden Bilder mit manipulativen Merkmalen versehen.
In einem Chatbot werden durch Interaktionen toxische Inhalte als "normal" trainiert.

Wie kann man sich schützen?

Maßnahmen gegen Data Poisoning umfassen:

Interaktive Aufgaben

Quiz: Teste Dein Wissen

Was bedeutet "Data Poisoning"? (Manipulation von Trainingsdaten zur Sabotage von KI-Modellen) (!Einsatz von echten Daten zur Verbesserung von KI) (!Test von Modellen mit synthetischen Daten) (!Entfernung fehlerhafter Daten aus einem Datensatz)

Was ist eine Backdoor-Attacke? (Ein Angriff, bei dem gezielte Trigger in Daten eingefügt werden) (!Ein Angriff durch Überlastung des Netzwerks) (!Eine Methode zur Verbesserung der Trainingsgeschwindigkeit) (!Ein legaler Zugang für Entwickler)

Was ist ein Ziel von Data Poisoning? (Sabotage oder Manipulation eines Modells) (!Erhöhung der Trainingsgeschwindigkeit) (!Verkleinerung des Modells) (!Erzeugung von Open-Source-Daten)

Welche Methode kann gegen Data Poisoning helfen? (Datenvalidierung) (!Label Flipping) (!Backdoor Attack) (!Label Injection)

Was versteht man unter Label Flipping? (Vertauschung von Klassenbeschriftungen in den Trainingsdaten) (!Verschlüsselung von Datenlabels) (!Manuelle Kennzeichnung durch Menschen) (!Veränderung der Trainingsarchitektur)

Welche Datenart ist besonders anfällig für Data Poisoning? (Unüberwachte Trainingsdaten aus offenen Quellen) (!Bereits bereinigte Daten) (!Manuell überprüfte Laborwerte) (!Verschlüsselte Dateien)

Was kann durch Data Poisoning verursacht werden? (Fehlentscheidungen von KI-Systemen) (!Erhöhte GPU-Leistung) (!Geringerer Stromverbrauch) (!Automatische Fehlerkorrektur)

Was ist ein typisches Ziel bei Targeted Attacks? (Spezifische Ausgaben des Modells zu beeinflussen) (!Komplette Datenbank zu zerstören) (!Daten zu anonymisieren) (!Trainingsdauer zu reduzieren)

Was hilft beim Erkennen von Poisoned Data? (Anomalie-Erkennung) (!Datenkompression) (!Transparenzberichte) (!Batch-Learning)

Wie nennt man das Entfernen von manipulierten Daten aus dem Trainingssatz? (Datenbereinigung) (!Datenmodifikation) (!Label Injection) (!Pipeline Reset)

Memory

Label Flipping	Vertauschung der Datenbeschriftung
Backdoor Attack	Eingeschleuste Trigger-Merkmale
Availability Attack	Generelle Sabotage der Modellleistung
Targeted Attack	Manipulation bestimmter Outputs
Datenvalidierung	Überprüfung auf Unregelmäßigkeiten

Drag and Drop

Ordne die richtigen Begriffe zu.	Data Poisoning-Angriffstypen
Label Flipping	Falsche Klassenzuweisung
Backdoor Attack	Geheime Steuerungsmerkmale
Availability Attack	Allgemeine Schwächung des Modells
Targeted Attack	Gezielte Ergebnismanipulation
Outlier Detection	Schutzmaßnahme

Kreuzworträtsel

Label	Wie nennt man eine Datenbeschriftung im Training?
Trigger	Was löst bei einer Backdoor-Attacke die Manipulation aus?
Anomalie	Fachbegriff für eine auffällige Datenabweichung?
Angriff	Was ist das Ziel von Data Poisoning grundsätzlich?
Schutz	Was benötigt man gegen Data Poisoning?
Modell	Was wird durch Data Poisoning beeinflusst?

LearningApps

Lückentext

Offene Aufgaben

Leicht

Was ist Data Poisoning?: Erkläre den Begriff in Deinen eigenen Worten.
Gefahren von Data Poisoning: Beschreibe eine konkrete Gefahr anhand eines Beispiels.
Trainingsdaten: Sammle Beispiele für Trainingsdaten aus dem Alltag.

Standard

Typen von Data Poisoning: Stelle die Unterschiede zwischen Label Flipping, Targeted Attack und Backdoor Attack in einer Tabelle dar.
Schutzmaßnahmen: Erstelle ein Plakat, wie man sich gegen Data Poisoning schützen kann.
Fallanalyse: Recherchiere einen realen Fall, bei dem ein KI-System manipuliert wurde.

Schwer

Simuliere Data Poisoning: Entwickle mit einem Partner ein kleines Beispielprojekt (z. B. in Python), das zeigt, wie sich manipulierte Daten auswirken können.
Ethik in der KI: Diskutiere in einem Aufsatz, ob KI-Systeme grundsätzlich anfällig für Sabotage sein sollten oder wie man sie sicherer machen könnte.
Interview führen: Interviewe eine Person aus dem IT-Bereich über ihre Erfahrungen mit Datensicherheit und Data Poisoning.

Lernkontrolle

Zusammenhang erkennen: Warum ist das Training von KI-Systemen ohne Datenvalidierung gefährlich?
Vergleich anstellen: Vergleiche Data Poisoning mit klassischem Hacking. Wo liegen Gemeinsamkeiten und Unterschiede?
Sicherheitsstrategie entwickeln: Entwerfe ein Konzept zur Erkennung von Poisoning-Vorfällen.
Technologien übertragen: Welche Schutzmaßnahmen gegen Data Poisoning lassen sich auch auf andere Systeme übertragen?
Langzeitfolgen einschätzen: Welche Folgen hat ein unbemerkter Angriff auf ein medizinisches KI-Modell langfristig?

OERs zum Thema

Links

Data Poisoning

Teilen - Diskussion - Bewerten

Schulfach+

Prüfungsliteratur 2026
Bundesland	Bücher	Kurzbeschreibung
Baden-Württemberg	Abitur Der zerbrochne Krug - Heinrich von Kleist Heimsuchung - Jenny Erpenbeck Mittlere Reife Der Markisenmann - Jan Weiler oder Als die Welt uns gehörte - Liz Kessler Ein Schatten wie ein Leopard - Myron Levoy oder Pampa Blues - Rolf Lappert	Abitur Dorfrichter-Komödie über Wahrheit/Schuld; Roman über einen Ort und deutsche Geschichte. Mittlere Reife Wahllektüren (Roadtrip-Vater-Sohn / Jugendroman im NS-Kontext / Coming-of-age / Provinzroman).
Bayern	Abitur Der zerbrochne Krug - Heinrich von Kleist Heimsuchung - Jenny Erpenbeck	Abitur Lustspiel über Machtmissbrauch und Recht; Roman als Zeitschnitt deutscher Geschichte an einem Haus/Grundstück.
Berlin/Brandenburg	Abitur Der zerbrochne Krug - Heinrich von Kleist Woyzeck - Georg Büchner Der Biberpelz - Gerhart Hauptmann Heimsuchung - Jenny Erpenbeck	Abitur Gerichtskomödie; soziales Drama um Ausbeutung/Armut; Komödie/Satire um Diebstahl und Obrigkeit; Roman über Erinnerungsräume und Umbrüche.
Bremen	Abitur Nach Mitternacht - Irmgard Keun Mario und der Zauberer - Thomas Mann Emilia Galotti - Gotthold Ephraim Lessing oder Miss Sara Sampson - Gotthold Ephraim Lessing	Abitur Roman in der NS-Zeit (Alltag, Anpassung, Angst); Novelle über Verführung/Massenpsychologie; bürgerliche Trauerspiele (Moral, Macht, Stand).
Hamburg	Abitur Der zerbrochne Krug - Heinrich von Kleist Das kunstseidene Mädchen - Irmgard Keun	Abitur Justiz-/Machtkritik als Komödie; Großstadtroman der Weimarer Zeit (Rollenbilder, Aufstiegsträume, soziale Realität).
Hessen	Abitur Der zerbrochne Krug - Heinrich von Kleist Woyzeck - Georg Büchner Heimsuchung - Jenny Erpenbeck Der Prozess - Franz Kafka	Abitur Gerichtskomödie; Fragmentdrama über Gewalt/Entmenschlichung; Erinnerungsroman über deutsche Brüche; moderner Roman über Schuld, Macht und Bürokratie.
Niedersachsen	Abitur Der zerbrochene Krug - Heinrich von Kleist Das kunstseidene Mädchen - Irmgard Keun Die Marquise von O. - Heinrich von Kleist Über das Marionettentheater - Heinrich von Kleist	Abitur Schwerpunkt auf Drama/Roman sowie Kleist-Prosatext und Essay (Ehre, Gewalt, Unschuld; Ästhetik/„Anmut“).
Nordrhein-Westfalen	Abitur Der zerbrochne Krug - Heinrich von Kleist Heimsuchung - Jenny Erpenbeck	Abitur Komödie über Wahrheit und Autorität; Roman als literarische „Geschichtsschichtung“ an einem Ort.
Saarland	Abitur Heimsuchung - Jenny Erpenbeck Furor - Lutz Hübner und Sarah Nemitz Bahnwärter Thiel - Gerhart Hauptmann	Abitur Erinnerungsroman an einem Ort; zeitgenössisches Drama über Eskalation/Populismus; naturalistische Novelle (Pflicht/Überforderung/Abgrund).
Sachsen (berufliches Gymnasium)	Abitur Der zerbrochne Krug - Heinrich von Kleist Woyzeck - Georg Büchner Irrungen, Wirrungen - Theodor Fontane Der gute Mensch von Sezuan - Bertolt Brecht Heimsuchung - Jenny Erpenbeck Der Trafikant - Robert Seethaler	Abitur Mischung aus Klassiker-Drama, sozialem Drama, realistischem Roman, epischem Theater und Gegenwarts-/Erinnerungsroman; zusätzlich Coming-of-age im historischen Kontext.
Sachsen-Anhalt	Abitur (keine fest benannte landesweite Pflichtlektüre veröffentlicht; Themenfelder)	Abitur Schwerpunktsetzung über Themenfelder (u. a. Literatur um 1900; Sprache in politisch-gesellschaftlichen Kontexten), ohne feste Einzeltitel.
Schleswig-Holstein	Abitur Der zerbrochne Krug - Heinrich von Kleist Heimsuchung - Jenny Erpenbeck	Abitur Recht/Gerechtigkeit und historische Tiefenschichten eines Ortes – umgesetzt über Drama und Gegenwartsroman.
Thüringen	Abitur (keine fest benannte landesweite Pflichtlektüre veröffentlicht; Orientierung am gemeinsamen Aufgabenpool)	Abitur In der Praxis häufig Orientierung am gemeinsamen Aufgabenpool; landesweite Einzeltitel je nach Vorgabe/Handreichung nicht einheitlich ausgewiesen.
Mecklenburg-Vorpommern	Abitur (Quelle aktuell technisch nicht abrufbar; Beteiligung am gemeinsamen Aufgabenpool bekannt)	Abitur Land beteiligt sich am länderübergreifenden Aufgabenpool; konkrete, veröffentlichte Einzeltitel konnten hier nicht ausgelesen werden.
Rheinland-Pfalz	Abitur (keine landesweit einheitliche Pflichtlektüre; schulische Auswahl)	Abitur Keine landesweite Einheitsliste; Auswahl kann schul-/kursbezogen erfolgen.

aiMOOCs

aiMOOC Projekte

THE MONKEY DANCE

The Monkey Dance | aiMOOCs

Trust Me It's True: #Verschwörungstheorie #FakeNews
Gregor Samsa Is You: #Kafka #Verwandlung
Who Owns Who: #Musk #Geld
Lump: #Trump #Manipulation
Filth Like You: #Konsum #Heuchelei
Your Poverty Pisses Me Off: #SozialeUngerechtigkeit #Musk
Hello I'm Pump: #Trump #Kapitalismus
Monkey Dance Party: #Lebensfreude
God Hates You Too: #Religionsfanatiker
You You You: #Klimawandel #Klimaleugner
Monkey Free: #Konformität #Macht #Kontrolle
Pure Blood: #Rassismus
Monkey World: #Chaos #Illusion #Manipulation
Uh Uh Uh Poor You: #Kafka #BerichtAkademie #Doppelmoral
The Monkey Dance Song: #Gesellschaftskritik
Will You Be Mine: #Love
Arbeitsheft
And Thanks for Your Meat: #AntiFactoryFarming #AnimalRights #MeatIndustry

0.00

(0 Stimmen)

Sponsoren, Förderer, Kooperationspartner

Children for a better world >> Förderung der AI Fair-Image Challenge

Fair-Image wird von CHILDREN JUGEND HILFT! gefördert und ist mit der deutschlandweiten AI Fair-Image Challenge SIEGERPROJEKT 2025. Alle Infos zur Challenge hier >>. Infos zum Camp25 gibt es hier. Wenn auch Ihr Euch ehrenamtlich engagiert und noch finanzielle Unterstützung für Eurer Projekt braucht, dann stellt gerne einen Antrag bei JUGEND HILFT.

Datei:Logo Deutscher Engagementpreis.svg