Maschinelles Lernen - Daten sammeln und für einfache maschinelle Lernprojekte aufbereiten - M - Kompetenzraster Informatik 7

Version vom 18. März 2024, 17:40 Uhr von Glanz (Diskussion | Beiträge) (Die Seite wurde neu angelegt: „{{:MOOCit - Oben}} {| align=center {{:D-Tab}} '''Daten sammeln und aufbereiten''' {{o}} Datensammlung {{o}} Datenbereinigung {{o}} Feature Engineering {{o}} Normalisierung |} = Einleitung = Im Bereich der künstlichen Intelligenz und des maschinellen Lernens ist die Sammlung und Aufbereitung von Daten einer der grundlegendsten Schritte. Ohne Daten gibt es kein Lerne…“)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)



Maschinelles Lernen - Daten sammeln und für einfache maschinelle Lernprojekte aufbereiten - M - Kompetenzraster Informatik 7


Einleitung

Im Bereich der künstlichen Intelligenz und des maschinellen Lernens ist die Sammlung und Aufbereitung von Daten einer der grundlegendsten Schritte. Ohne Daten gibt es kein Lernen, keine Mustererkennung und keine Vorhersagen. In diesem aiMOOC wirst Du lernen, wie Daten für einfache maschinelle Lernprojekte gesammelt, bereinigt, und aufbereitet werden. Diese Fähigkeiten sind essenziell, um maschinelle Lernmodelle effektiv trainieren zu können.


Daten sammeln


Datenquellen identifizieren

Bevor Du mit dem Sammeln von Daten beginnen kannst, musst Du zunächst passende Datenquellen identifizieren. Datenquellen können vielfältig sein – von Online-Datenbanken und APIs über soziale Medien bis hin zu öffentlichen Datensätzen, die von Forschungsinstituten bereitgestellt werden.

  1. Open Data-Portale wie data.gov oder data.europa.eu
  2. APIs (Application Programming Interfaces) für den Zugriff auf Daten von Websites oder Diensten
  3. Umfragen und Experimente, um eigene Daten zu generieren


Es ist wichtig, beim Sammeln von Daten die rechtlichen und ethischen Richtlinien zu beachten.

  1. Überprüfe die Datenschutz-Richtlinien und stelle sicher, dass die Datensammlung den lokalen Gesetzen entspricht.
  2. Berücksichtige die Ethik beim Umgang mit personenbezogenen Daten und verwende sie respektvoll.


Daten aufbereiten


Datenbereinigung

Sobald die Daten gesammelt sind, ist der nächste Schritt die Datenbereinigung. Dieser Schritt ist entscheidend, um die Qualität der Daten zu gewährleisten.

  1. Entferne Duplikate, um Redundanzen in den Daten zu vermeiden.
  2. Behandle fehlende Werte durch Methoden wie das Entfernen von Einträgen oder das Ersetzen durch Durchschnittswerte (Imputation).
  3. Korrigiere offensichtliche Fehler in den Daten, wie z.B. Tippfehler oder falsche Einheiten.


Feature Engineering

Feature Engineering ist der Prozess der Auswahl, Modifikation oder Erstellung neuer Merkmale (Features) aus den vorhandenen Daten, um die Leistung der maschinellen Lernmodelle zu verbessern.

  1. Normalisierung und Standardisierung von Daten zur besseren Verarbeitung durch das Modell.
  2. Auswahl relevanter Features, um das Modell nicht mit irrelevanten Informationen zu überlasten.
  3. Erstellung neuer Features durch Kombination oder Transformation bestehender Datenpunkte.


Interaktive Aufgaben


Quiz: Teste Dein Wissen

Welche der folgenden Optionen ist eine gängige Quelle für die Datensammlung? (Open Data-Portale) (!Bücher in einer öffentlichen Bibliothek) (!Persönliche Notizen) (!Handschriftliche Briefe)

Was ist ein wichtiger Schritt bei der Datenbereinigung? (Entfernen von Duplikaten) (!Erhöhen der Datenmenge) (!Ändern der Datenfarbe) (!Hinzufügen von Zufallsdaten)

Was versteht man unter Feature Engineering? (Die Auswahl, Modifikation oder Erstellung neuer Merkmale aus vorhandenen Daten) (!Das Kopieren von Features aus einem anderen Dataset) (!Das Löschen aller Features außer einem) (!Die Verschlüsselung der Daten)

Warum ist die Normalisierung von Daten wichtig? (Um die Daten besser durch das Modell verarbeiten zu lassen) (!Um die Datenmenge zu erhöhen) (!Um die Daten zu verschlüsseln) (!Um die Datenfarbe zu ändern)

Welcher der folgenden Punkte gehört nicht zu den ethischen Richtlinien beim Sammeln von Daten? (!Das Hinzufügen von Zufallsdaten zu den gesammelten Daten) (Achten auf Datenschutzrichtlinien) (Respektvoller Umgang mit personenbezogenen Daten) (Einhaltung der lokalen Gesetze)





Memory

Open Data Öffentliche Datenportale
Normalisierung Anpassung von Daten auf einen gemeinsamen Maßstab
Duplikate entfernen Bereinigungsschritt in der Datenaufbereitung
APIs Schnittstellen für den Zugriff auf Online-Daten
Feature Engineering Prozess zur Verbesserung von Datenmerkmalen





Kreuzworträtsel

datenquellen Woher können Daten gesammelt werden?
duplikate Was sollte aus den Daten entfernt werden, um Redundanzen zu vermeiden?
normalisierung Welcher Prozess passt Daten an einen gemeinsamen Maßstab an?
features Was wird im Prozess des Feature Engineering modifiziert oder neu erstellt?
ethik Welches Prinzip muss beim Sammeln von Daten immer berücksichtigt werden?




LearningApps

Lückentext

Vervollständige den Text.

Die Auswahl von

ist der erste Schritt bei der Datensammlung. Datenbereinigung beinhaltet das Entfernen von

und das Behandeln von

. Im Feature Engineering werden neue

aus vorhandenen Daten erstellt.

Offene Aufgaben

Leicht

  1. Recherchiere und liste drei öffentliche Open Data-Portale auf.
  2. Identifiziere ein Datenproblem (z.B. fehlende Werte) in einem Datensatz und überlege, wie dieses Problem gelöst werden könnte.
  3. Erkläre, warum Datenschutz und Ethik bei der Datensammlung wichtig sind.

Standard

  1. Führe eine kleine Datensammlung durch, indem Du Daten aus einem öffentlichen API sammelst und speicherst.
  2. Führe eine einfache Datenbereinigung durch: Entferne Duplikate und behandle fehlende Werte in einem kleinen Datensatz.
  3. Entwickle ein Konzept für ein einfaches Feature Engineering, indem Du neue Features aus bestehenden Daten eines Datensatzes erstellst.

Schwer

  1. Implementiere einen kleinen Datensammelprozess, indem Du ein Skript schreibst, das Daten automatisch von einer ausgewählten Quelle sammelt.
  2. Entwickle und wende eine Methode zur Normalisierung und Standardisierung eines realen Datensatzes an.
  3. Erstelle ein komplexes Feature-Engineering-Projekt, indem Du mehrere neue Features entwickelst und ihre Wirksamkeit in einem maschinellen Lernprojekt bewertest.




Text bearbeiten Bild einfügen Video einbetten Interaktive Aufgaben erstellen


Lernkontrolle

  1. Diskutiere, wie die Qualität der Datensammlung das Endergebnis eines maschinellen Lernprojekts beeinflussen kann.
  2. Erkläre, wie die Auswahl von Features das Training und die Leistung eines maschinellen Lernmodells beeinflussen kann.
  3. Vergleiche und kontrastiere die Methoden der Datenbereinigung und ihre Auswirkungen auf die Datenqualität.
  4. Bewerte verschiedene Strategien des Feature Engineerings und ihre potenzielle Auswirkung auf maschinelle Lernmodelle.
  5. Entwirf ein ethisches Rahmenwerk für die Datensammlung in einem maschinellen Lernprojekt.



OERs zum Thema


Links

Teilen - Diskussion - Bewerten





Schulfach+

Prüfungsliteratur 2026
Bundesland Bücher Kurzbeschreibung
Baden-Württemberg

Abitur

  1. Der zerbrochne Krug - Heinrich von Kleist
  2. Heimsuchung - Jenny Erpenbeck

Mittlere Reife

  1. Der Markisenmann - Jan Weiler oder Als die Welt uns gehörte - Liz Kessler
  2. Ein Schatten wie ein Leopard - Myron Levoy oder Pampa Blues - Rolf Lappert

Abitur Dorfrichter-Komödie über Wahrheit/Schuld; Roman über einen Ort und deutsche Geschichte. Mittlere Reife Wahllektüren (Roadtrip-Vater-Sohn / Jugendroman im NS-Kontext / Coming-of-age / Provinzroman).

Bayern

Abitur

  1. Der zerbrochne Krug - Heinrich von Kleist
  2. Heimsuchung - Jenny Erpenbeck

Abitur Lustspiel über Machtmissbrauch und Recht; Roman als Zeitschnitt deutscher Geschichte an einem Haus/Grundstück.

Berlin/Brandenburg

Abitur

  1. Der zerbrochne Krug - Heinrich von Kleist
  2. Woyzeck - Georg Büchner
  3. Der Biberpelz - Gerhart Hauptmann
  4. Heimsuchung - Jenny Erpenbeck

Abitur Gerichtskomödie; soziales Drama um Ausbeutung/Armut; Komödie/Satire um Diebstahl und Obrigkeit; Roman über Erinnerungsräume und Umbrüche.

Bremen

Abitur

  1. Nach Mitternacht - Irmgard Keun
  2. Mario und der Zauberer - Thomas Mann
  3. Emilia Galotti - Gotthold Ephraim Lessing oder Miss Sara Sampson - Gotthold Ephraim Lessing

Abitur Roman in der NS-Zeit (Alltag, Anpassung, Angst); Novelle über Verführung/Massenpsychologie; bürgerliche Trauerspiele (Moral, Macht, Stand).

Hamburg

Abitur

  1. Der zerbrochne Krug - Heinrich von Kleist
  2. Das kunstseidene Mädchen - Irmgard Keun

Abitur Justiz-/Machtkritik als Komödie; Großstadtroman der Weimarer Zeit (Rollenbilder, Aufstiegsträume, soziale Realität).

Hessen

Abitur

  1. Der zerbrochne Krug - Heinrich von Kleist
  2. Woyzeck - Georg Büchner
  3. Heimsuchung - Jenny Erpenbeck
  4. Der Prozess - Franz Kafka

Abitur Gerichtskomödie; Fragmentdrama über Gewalt/Entmenschlichung; Erinnerungsroman über deutsche Brüche; moderner Roman über Schuld, Macht und Bürokratie.

Niedersachsen

Abitur

  1. Der zerbrochene Krug - Heinrich von Kleist
  2. Das kunstseidene Mädchen - Irmgard Keun
  3. Die Marquise von O. - Heinrich von Kleist
  4. Über das Marionettentheater - Heinrich von Kleist

Abitur Schwerpunkt auf Drama/Roman sowie Kleist-Prosatext und Essay (Ehre, Gewalt, Unschuld; Ästhetik/„Anmut“).

Nordrhein-Westfalen

Abitur

  1. Der zerbrochne Krug - Heinrich von Kleist
  2. Heimsuchung - Jenny Erpenbeck

Abitur Komödie über Wahrheit und Autorität; Roman als literarische „Geschichtsschichtung“ an einem Ort.

Saarland

Abitur

  1. Heimsuchung - Jenny Erpenbeck
  2. Furor - Lutz Hübner und Sarah Nemitz
  3. Bahnwärter Thiel - Gerhart Hauptmann

Abitur Erinnerungsroman an einem Ort; zeitgenössisches Drama über Eskalation/Populismus; naturalistische Novelle (Pflicht/Überforderung/Abgrund).

Sachsen (berufliches Gymnasium)

Abitur

  1. Der zerbrochne Krug - Heinrich von Kleist
  2. Woyzeck - Georg Büchner
  3. Irrungen, Wirrungen - Theodor Fontane
  4. Der gute Mensch von Sezuan - Bertolt Brecht
  5. Heimsuchung - Jenny Erpenbeck
  6. Der Trafikant - Robert Seethaler

Abitur Mischung aus Klassiker-Drama, sozialem Drama, realistischem Roman, epischem Theater und Gegenwarts-/Erinnerungsroman; zusätzlich Coming-of-age im historischen Kontext.

Sachsen-Anhalt

Abitur

  1. (keine fest benannte landesweite Pflichtlektüre veröffentlicht; Themenfelder)

Abitur Schwerpunktsetzung über Themenfelder (u. a. Literatur um 1900; Sprache in politisch-gesellschaftlichen Kontexten), ohne feste Einzeltitel.

Schleswig-Holstein

Abitur

  1. Der zerbrochne Krug - Heinrich von Kleist
  2. Heimsuchung - Jenny Erpenbeck

Abitur Recht/Gerechtigkeit und historische Tiefenschichten eines Ortes – umgesetzt über Drama und Gegenwartsroman.

Thüringen

Abitur

  1. (keine fest benannte landesweite Pflichtlektüre veröffentlicht; Orientierung am gemeinsamen Aufgabenpool)

Abitur In der Praxis häufig Orientierung am gemeinsamen Aufgabenpool; landesweite Einzeltitel je nach Vorgabe/Handreichung nicht einheitlich ausgewiesen.

Mecklenburg-Vorpommern

Abitur

  1. (Quelle aktuell technisch nicht abrufbar; Beteiligung am gemeinsamen Aufgabenpool bekannt)

Abitur Land beteiligt sich am länderübergreifenden Aufgabenpool; konkrete, veröffentlichte Einzeltitel konnten hier nicht ausgelesen werden.

Rheinland-Pfalz

Abitur

  1. (keine landesweit einheitliche Pflichtlektüre; schulische Auswahl)

Abitur Keine landesweite Einheitsliste; Auswahl kann schul-/kursbezogen erfolgen.




aiMOOCs



aiMOOC Projekte












THE MONKEY DANCE




The Monkey DanceaiMOOCs

  1. Trust Me It's True: #Verschwörungstheorie #FakeNews
  2. Gregor Samsa Is You: #Kafka #Verwandlung
  3. Who Owns Who: #Musk #Geld
  4. Lump: #Trump #Manipulation
  5. Filth Like You: #Konsum #Heuchelei
  6. Your Poverty Pisses Me Off: #SozialeUngerechtigkeit #Musk
  7. Hello I'm Pump: #Trump #Kapitalismus
  8. Monkey Dance Party: #Lebensfreude
  9. God Hates You Too: #Religionsfanatiker
  10. You You You: #Klimawandel #Klimaleugner
  11. Monkey Free: #Konformität #Macht #Kontrolle
  12. Pure Blood: #Rassismus
  13. Monkey World: #Chaos #Illusion #Manipulation
  14. Uh Uh Uh Poor You: #Kafka #BerichtAkademie #Doppelmoral
  15. The Monkey Dance Song: #Gesellschaftskritik
  16. Will You Be Mine: #Love
  17. Arbeitsheft
  18. And Thanks for Your Meat: #AntiFactoryFarming #AnimalRights #MeatIndustry


© The Monkey Dance on Spotify, YouTube, Amazon, MOOCit, Deezer, ...



Text bearbeiten Bild einfügen Video einbetten Interaktive Aufgaben erstellen

Teilen Facebook Twitter Google Mail an MOOCit Missbrauch melden Zertifikat beantragen


0.00
(0 Stimmen)



Sponsoren, Förderer, Kooperationspartner








Children for a better world >> Förderung der AI Fair-Image Challenge

Fair-Image wird von CHILDREN JUGEND HILFT! gefördert und ist mit der deutschlandweiten AI Fair-Image Challenge SIEGERPROJEKT 2025. Alle Infos zur Challenge hier >>. Infos zum Camp25 gibt es hier. Wenn auch Ihr Euch ehrenamtlich engagiert und noch finanzielle Unterstützung für Eurer Projekt braucht, dann stellt gerne einen Antrag bei JUGEND HILFT.