Data Poisoning


Einleitung

In diesem aiMOOC geht es um das wichtige und zunehmend relevante Thema Data Poisoning. Dabei handelt es sich um gezielte Manipulationen von Trainingsdaten in Maschinellem Lernen und Künstlicher Intelligenz (KI), mit dem Ziel, die Modelle zu sabotieren oder unerwünschte Effekte hervorzurufen. Data Poisoning ist eine Form von Cyberangriff und kann schwerwiegende Auswirkungen auf automatisierte Systeme, wie beispielsweise in der Gesichtserkennung, bei Chatbots oder in der Medizinischen Diagnostik haben.

In diesem MOOC erfährst Du, was Data Poisoning genau ist, wie es funktioniert, welche Arten es gibt, welche Risiken damit verbunden sind und wie man sich dagegen schützen kann.


Was ist Data Poisoning?


Definition und Grundprinzip

Data Poisoning bezeichnet das absichtliche Einbringen von fehlerhaften, manipulierten oder schädlichen Daten in einen Trainingsdatensatz, um die Leistung eines Maschinellen Lernmodells zu verschlechtern oder es in eine bestimmte Richtung zu beeinflussen.

Die Idee dahinter ist ähnlich wie bei einer Vergiftung – das System wird durch scheinbar normale, aber schädliche Daten korrumpiert.


Warum ist Data Poisoning gefährlich?

Data Poisoning kann zu folgenden Konsequenzen führen:

  1. Fehlentscheidungen in autonomen Systemen (z. B. Autos)
  2. Manipulierte Diagnosen in medizinischer KI
  3. Vertrauensverlust in KI-gestützte Systeme
  4. Cyberangriffe durch gezielte Schwächung von Sicherheitsmechanismen
  5. Diskriminierende Modelle durch gezielte Verzerrung


Arten von Data Poisoning

Es gibt mehrere Varianten von Data Poisoning:

  1. Label Flipping: Falsche Zuordnung von Labels (z. B. Hund als Katze)
  2. Backdoor Attack: Einfügen spezieller Merkmale, um das Modell zu kontrollieren
  3. Availability Attack: Sabotage der Modellleistung insgesamt
  4. Targeted Attack: Angriff auf bestimmte Ausgaben des Modells


Beispiele für Data Poisoning

  1. In einem Spamfilter werden gezielt "harmlose" Spam-Mails eingefügt, um ihn zu verwirren.
  2. In einer Bilddatenbank werden Bilder mit manipulativen Merkmalen versehen.
  3. In einem Chatbot werden durch Interaktionen toxische Inhalte als "normal" trainiert.


Wie kann man sich schützen?

Maßnahmen gegen Data Poisoning umfassen:

  1. Datenvalidierung und Datenbereinigung
  2. Robuste Trainingsverfahren
  3. Anomalie-Erkennung und Outlier Detection
  4. Differential Privacy und Federated Learning


Interaktive Aufgaben


Quiz: Teste Dein Wissen

Was bedeutet "Data Poisoning"? (Manipulation von Trainingsdaten zur Sabotage von KI-Modellen) (!Einsatz von echten Daten zur Verbesserung von KI) (!Test von Modellen mit synthetischen Daten) (!Entfernung fehlerhafter Daten aus einem Datensatz)

Was ist eine Backdoor-Attacke? (Ein Angriff, bei dem gezielte Trigger in Daten eingefügt werden) (!Ein Angriff durch Überlastung des Netzwerks) (!Eine Methode zur Verbesserung der Trainingsgeschwindigkeit) (!Ein legaler Zugang für Entwickler)

Was ist ein Ziel von Data Poisoning? (Sabotage oder Manipulation eines Modells) (!Erhöhung der Trainingsgeschwindigkeit) (!Verkleinerung des Modells) (!Erzeugung von Open-Source-Daten)

Welche Methode kann gegen Data Poisoning helfen? (Datenvalidierung) (!Label Flipping) (!Backdoor Attack) (!Label Injection)

Was versteht man unter Label Flipping? (Vertauschung von Klassenbeschriftungen in den Trainingsdaten) (!Verschlüsselung von Datenlabels) (!Manuelle Kennzeichnung durch Menschen) (!Veränderung der Trainingsarchitektur)

Welche Datenart ist besonders anfällig für Data Poisoning? (Unüberwachte Trainingsdaten aus offenen Quellen) (!Bereits bereinigte Daten) (!Manuell überprüfte Laborwerte) (!Verschlüsselte Dateien)

Was kann durch Data Poisoning verursacht werden? (Fehlentscheidungen von KI-Systemen) (!Erhöhte GPU-Leistung) (!Geringerer Stromverbrauch) (!Automatische Fehlerkorrektur)

Was ist ein typisches Ziel bei Targeted Attacks? (Spezifische Ausgaben des Modells zu beeinflussen) (!Komplette Datenbank zu zerstören) (!Daten zu anonymisieren) (!Trainingsdauer zu reduzieren)

Was hilft beim Erkennen von Poisoned Data? (Anomalie-Erkennung) (!Datenkompression) (!Transparenzberichte) (!Batch-Learning)

Wie nennt man das Entfernen von manipulierten Daten aus dem Trainingssatz? (Datenbereinigung) (!Datenmodifikation) (!Label Injection) (!Pipeline Reset)





Memory

Label Flipping Vertauschung der Datenbeschriftung
Backdoor Attack Eingeschleuste Trigger-Merkmale
Availability Attack Generelle Sabotage der Modellleistung
Targeted Attack Manipulation bestimmter Outputs
Datenvalidierung Überprüfung auf Unregelmäßigkeiten





Drag and Drop

Ordne die richtigen Begriffe zu. Data Poisoning-Angriffstypen
Label Flipping Falsche Klassenzuweisung
Backdoor Attack Geheime Steuerungsmerkmale
Availability Attack Allgemeine Schwächung des Modells
Targeted Attack Gezielte Ergebnismanipulation
Outlier Detection Schutzmaßnahme



Kreuzworträtsel

Label Wie nennt man eine Datenbeschriftung im Training?
Trigger Was löst bei einer Backdoor-Attacke die Manipulation aus?
Anomalie Fachbegriff für eine auffällige Datenabweichung?
Angriff Was ist das Ziel von Data Poisoning grundsätzlich?
Schutz Was benötigt man gegen Data Poisoning?
Modell Was wird durch Data Poisoning beeinflusst?




LearningApps

Lückentext

Vervollständige den Text.

Data Poisoning ist eine Form des

, bei dem Trainingsdaten absichtlich manipuliert werden. Eine bekannte Methode ist das

, bei dem Daten falsch beschriftet werden. Eine andere Variante ist die

, bei der spezielle Merkmale eingebaut werden. Schutzmaßnahmen beinhalten unter anderem

und den Einsatz von

.



Offene Aufgaben

Leicht

  1. Was ist Data Poisoning?: Erkläre den Begriff in Deinen eigenen Worten.
  2. Gefahren von Data Poisoning: Beschreibe eine konkrete Gefahr anhand eines Beispiels.
  3. Trainingsdaten: Sammle Beispiele für Trainingsdaten aus dem Alltag.

Standard

  1. Typen von Data Poisoning: Stelle die Unterschiede zwischen Label Flipping, Targeted Attack und Backdoor Attack in einer Tabelle dar.
  2. Schutzmaßnahmen: Erstelle ein Plakat, wie man sich gegen Data Poisoning schützen kann.
  3. Fallanalyse: Recherchiere einen realen Fall, bei dem ein KI-System manipuliert wurde.

Schwer

  1. Simuliere Data Poisoning: Entwickle mit einem Partner ein kleines Beispielprojekt (z. B. in Python), das zeigt, wie sich manipulierte Daten auswirken können.
  2. Ethik in der KI: Diskutiere in einem Aufsatz, ob KI-Systeme grundsätzlich anfällig für Sabotage sein sollten oder wie man sie sicherer machen könnte.
  3. Interview führen: Interviewe eine Person aus dem IT-Bereich über ihre Erfahrungen mit Datensicherheit und Data Poisoning.




Text bearbeiten Bild einfügen Video einbetten Interaktive Aufgaben erstellen


Lernkontrolle

  1. Zusammenhang erkennen: Warum ist das Training von KI-Systemen ohne Datenvalidierung gefährlich?
  2. Vergleich anstellen: Vergleiche Data Poisoning mit klassischem Hacking. Wo liegen Gemeinsamkeiten und Unterschiede?
  3. Sicherheitsstrategie entwickeln: Entwerfe ein Konzept zur Erkennung von Poisoning-Vorfällen.
  4. Technologien übertragen: Welche Schutzmaßnahmen gegen Data Poisoning lassen sich auch auf andere Systeme übertragen?
  5. Langzeitfolgen einschätzen: Welche Folgen hat ein unbemerkter Angriff auf ein medizinisches KI-Modell langfristig?



OERs zum Thema


Links

Teilen - Diskussion - Bewerten





Schulfach+




aiMOOCs



aiMOOC Projekte












YouTube Music: THE MONKEY DANCE


Spotify: THE MONKEY DANCE


Apple Music: THE MONKEY DANCE

Amazon Music: THE MONKEY DANCE



The Monkey Dance SpreadShirtShop




The Monkey DanceaiMOOCs

  1. Trust Me It's True: #Verschwörungstheorie #FakeNews
  2. Gregor Samsa Is You: #Kafka #Verwandlung
  3. Who Owns Who: #Musk #Geld
  4. Lump: #Trump #Manipulation
  5. Filth Like You: #Konsum #Heuchelei
  6. Your Poverty Pisses Me Off: #SozialeUngerechtigkeit #Musk
  7. Hello I'm Pump: #Trump #Kapitalismus
  8. Monkey Dance Party: #Lebensfreude
  9. God Hates You Too: #Religionsfanatiker
  10. You You You: #Klimawandel #Klimaleugner
  11. Monkey Free: #Konformität #Macht #Kontrolle
  12. Pure Blood: #Rassismus
  13. Monkey World: #Chaos #Illusion #Manipulation
  14. Uh Uh Uh Poor You: #Kafka #BerichtAkademie #Doppelmoral
  15. The Monkey Dance Song: #Gesellschaftskritik
  16. Will You Be Mine: #Love
  17. Arbeitsheft


© The Monkey Dance on Spotify, YouTube, Amazon, MOOCit, Deezer, ...



Text bearbeiten Bild einfügen Video einbetten Interaktive Aufgaben erstellen

Teilen Facebook Twitter Google Mail an MOOCit Missbrauch melden Zertifikat beantragen


0.00
(0 Stimmen)











Children for a better world >> Förderung der AI Fair-Image Challenge

Fair-Image wird von CHILDREN JUGEND HILFT! gefördert und ist mit der deutschlandweiten AI Fair-Image Challenge SIEGERPROJEKT 2025. Alle Infos zur Challenge hier >>. Infos zum Camp25 gibt es hier. Wenn auch Ihr Euch ehrenamtlich engagiert und noch finanzielle Unterstützung für Eurer Projekt braucht, dann stellt gerne einen Antrag bei JUGEND HILFT.