K-means Clustering

Version vom 26. März 2024, 20:33 Uhr von Glanz (Diskussion | Beiträge) (Die Seite wurde neu angelegt: „{{:MOOCit - Oben}} {| align=center {{:D-Tab}} '''K-means Clustering''' {{o}} Maschinelles Lernen {{o}} Datenanalyse {{o}} Bilderkennung {{o}} Marktsegmentierung |} = Einleitung = In diesem aiMOOC befassen wir uns ausführlich mit dem Verfahren des K-means Clustering. K-means Clustering ist eine weitverbreitete Methode im Bereich des maschinellen Lernens und der Datenanalyse. Es handelt sich um ein Verfahren zur Gruppierung oder Segmen…“)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)



K-means Clustering


Einleitung

In diesem aiMOOC befassen wir uns ausführlich mit dem Verfahren des K-means Clustering. K-means Clustering ist eine weitverbreitete Methode im Bereich des maschinellen Lernens und der Datenanalyse. Es handelt sich um ein Verfahren zur Gruppierung oder Segmentierung von Datenpunkten in eine vorher festgelegte Anzahl von Gruppen (Cluster) basierend auf Ähnlichkeiten. Das Ziel ist es, die Datenpunkte so aufzuteilen, dass die Punkte innerhalb eines Clusters möglichst ähnlich (homogen) und die Cluster untereinander möglichst unterschiedlich (heterogen) sind. Dieser MOOC bietet Dir eine detaillierte Einführung in die Grundlagen, die mathematische Funktionsweise, Anwendungsbeispiele sowie praktische Übungen zum K-means Clustering.


Was ist K-means Clustering?

K-means Clustering ist ein Verfahren aus dem Bereich des unüberwachten Lernens, bei dem eine Menge von Datenpunkten in k Gruppen (Cluster) aufgeteilt wird. Die Anzahl der Cluster, k, ist dabei eine vorher festgelegte Größe. Das Verfahren zielt darauf ab, die Summe der quadrierten Distanzen zwischen den Datenpunkten und den jeweiligen Clusterzentren zu minimieren. Hierbei wird versucht, die Datenpunkte so zu gruppieren, dass sie zu dem ihnen nächstliegenden Mittelpunkt (Centroid) des Clusters gehören, was zu einer Minimierung der inneren Cluster-Variabilität führt.

Grundprinzipien von K-means Clustering

K-means Clustering folgt einem einfachen, aber leistungsfähigen Algorithmus:

  1. Initialisierung: Zufällige Auswahl von k Datenpunkten als initiale Clusterzentren (Centroids).
  2. Zuordnung: Jeder Datenpunkt wird dem nächstgelegenen Centroid zugeordnet, was zu vorläufigen Clustern führt.
  3. Aktualisierung: Berechnung neuer Centroids durch Mittelwertbildung der zugeordneten Datenpunkte.
  4. Wiederholung: Die Schritte Zuordnung und Aktualisierung werden wiederholt, bis keine wesentlichen Änderungen der Clusterzentren mehr stattfinden.

Anwendungsgebiete

K-means Clustering findet Anwendung in einer Vielzahl von Bereichen, unter anderem:

  1. Marktsegmentierung: Gruppierung von Kunden mit ähnlichem Kaufverhalten.
  2. Bilderkennung: Segmentierung von Bildern in farblich ähnliche Bereiche.
  3. Datenanalyse: Strukturierung großer Datensätze zur Erkennung von Mustern und Trends.
  4. Soziale Netzwerkanalyse: Identifizierung von Gruppen mit ähnlichen Interessen oder Verbindungen.

Vorteile und Herausforderungen

Vorteile:

  1. Einfachheit und Effizienz, besonders bei großen Datensätzen.
  2. Leichte Interpretierbarkeit der Ergebnisse.

Herausforderungen:

  1. Wahl der richtigen Anzahl von Clustern k kann schwierig sein.
  2. Sensibilität gegenüber den initialen Centroids.
  3. Kann Schwierigkeiten haben, Cluster mit nicht-kugelförmigen Formen zu erkennen.


Interaktive Aufgaben


Quiz: Teste Dein Wissen

Wie viele Schritte hat der grundlegende K-means Clustering Algorithmus? (4) (!3) (!5) (!2)

Zu welcher Art von Lernverfahren gehört K-means Clustering? (Unüberwachtes Lernen) (!Überwachtes Lernen) (!Bestärkendes Lernen) (!Semi-überwachtes Lernen)

Was wird bei K-means Clustering minimiert? (Die Summe der quadrierten Distanzen zwischen den Datenpunkten und den jeweiligen Clusterzentren) (!Die maximale Distanz zwischen den Datenpunkten und den jeweiligen Clusterzentren) (!Die Summe der Distanzen zwischen allen Datenpunkten) (!Die Anzahl der Datenpunkte in jedem Cluster)

Welcher Schritt folgt unmittelbar nach der Initialisierung der Clusterzentren beim K-means Clustering? (Zuordnung der Datenpunkte zu den nächstgelegenen Centroids) (!Berechnung der Distanz zwischen allen Datenpunkten) (!Auswahl neuer Datenpunkte als Clusterzentren) (!Minimierung der Varianz innerhalb der Cluster)

Was ist eine Herausforderung beim K-means Clustering? (Wahl der richtigen Anzahl von Clustern k) (!Berechnung der Distanzen zwischen den Datenpunkten) (!Überwachung des Lernprozesses) (!Bestimmung der Attribute der Datenpunkte)





Memory

Unüberwachtes Lernen K-means gehört zu dieser Art von Lernverfahren
Centroid Der Mittelpunkt eines Clusters
Marktsegmentierung Ein Anwendungsbereich von K-means
Initialisierung Erster Schritt im K-means Algorithmus
Varianzminimierung Ziel von K-means Clustering





Kreuzworträtsel

Centroid Der Mittelpunkt eines Clusters
Cluster Eine Gruppe ähnlicher Datenpunkte
Kmeans Name des hier beschriebenen Algorithmus
Variabilität Was innerhalb eines Clusters minimiert werden soll
Marktsegmentierung Anwendungsbereich für K-means
Datenpunkt Ein Element, das gruppiert wird
Initialisierung Startschritt des Algorithmus
Varianz Das, was minimiert werden soll




LearningApps

Lückentext

Vervollständige den Text.

K-means Clustering ist ein Verfahren aus dem Bereich des

, das Datenpunkte in

(Cluster) aufteilt, basierend auf ihrer

. Die Anzahl der Cluster,

, ist dabei eine vorher festgelegte Größe. Der Algorithmus zielt darauf ab, die

zwischen den Datenpunkten und den jeweiligen Clusterzentren zu minimieren. Dies geschieht durch einen iterativen Prozess von

und

der Clusterzentren, bis keine wesentlichen Änderungen mehr stattfinden.



Offene Aufgaben

Leicht

  1. Reflektiere über Anwendungsbereiche: Denke über andere potenzielle Anwendungsbereiche für K-means Clustering nach, die nicht in diesem Kurs erwähnt wurden. Schreibe einen kurzen Absatz über einen neuen Anwendungsbereich.
  2. Experiment mit Datensätzen: Finde einen einfachen Datensatz online und wende darauf manuell die ersten Schritte des K-means Algorithmus an. Dokumentiere deine Vorgehensweise und Ergebnisse.

Standard

  1. Implementiere K-means in Python: Schreibe einen einfachen K-means Clustering Algorithmus in Python. Verwende dafür eine Standardbibliothek wie NumPy für die Berechnungen.
  2. Vergleiche Clustering-Methoden: Vergleiche K-means mit einem anderen Clustering-Verfahren, z.B. hierarchisches Clustering. Diskutiere die Unterschiede in Bezug auf Anwendung, Effizienz und Ergebnisse.

Schwer

  1. Erweitere K-means: Entwickle eine Variation des K-means Algorithmus, die es ermöglicht, mit nicht-kugelförmigen Clustern umzugehen. Beschreibe deine Idee und überlege, wie du sie testen könntest.
  2. Analyse realer Datensätze: Wähle einen komplexen, realen Datensatz und führe eine Clusteranalyse mit K-means durch. Interpretiere die Ergebnisse und diskutiere mögliche Herausforderungen bei der Datenanalyse.




Text bearbeiten Bild einfügen Video einbetten Interaktive Aufgaben erstellen



Lernkontrolle

  1. Analysiere die Clusterbildung: Beschreibe, wie sich die Wahl von k auf die Clusterbildung und die Interpretation der Ergebnisse auswirkt. Warum ist es wichtig, das richtige k zu wählen?
  2. Bewerte die Initialisierungsmethoden: Diskutiere, wie verschiedene Initialisierungsmethoden für die Centroids die Qualität des Endergebnisses beeinflussen können. Welche Methoden gibt es und welche Vor- und Nachteile haben sie?
  3. Optimiere den Algorithmus: Überlege, wie der K-means Algorithmus optimiert werden könnte, um mit großen Datensätzen effizienter umzugehen. Welche Strategien könnten hierfür angewendet werden?
  4. Reflektiere über die Ergebnisse: Erkläre, wie die Ergebnisse des K-means Clustering interpretiert werden können und welche Schritte folgen sollten, um aus diesen Erkenntnissen Nutzen zu ziehen.
  5. Vergleiche mit anderen Algorithmen: Vergleiche K-means Clustering mit mindestens einem anderen Clustering-Algorithmus in Bezug auf Anwendungsbereiche, Stärken und Schwächen.



OERs zum Thema


Links

Teilen - Diskussion - Bewerten





Schulfach+

Prüfungsliteratur 2026
Bundesland Bücher Kurzbeschreibung
Baden-Württemberg

Abitur

  1. Der zerbrochne Krug - Heinrich von Kleist
  2. Heimsuchung - Jenny Erpenbeck

Mittlere Reife

  1. Der Markisenmann - Jan Weiler oder Als die Welt uns gehörte - Liz Kessler
  2. Ein Schatten wie ein Leopard - Myron Levoy oder Pampa Blues - Rolf Lappert

Abitur Dorfrichter-Komödie über Wahrheit/Schuld; Roman über einen Ort und deutsche Geschichte. Mittlere Reife Wahllektüren (Roadtrip-Vater-Sohn / Jugendroman im NS-Kontext / Coming-of-age / Provinzroman).

Bayern

Abitur

  1. Der zerbrochne Krug - Heinrich von Kleist
  2. Heimsuchung - Jenny Erpenbeck

Abitur Lustspiel über Machtmissbrauch und Recht; Roman als Zeitschnitt deutscher Geschichte an einem Haus/Grundstück.

Berlin/Brandenburg

Abitur

  1. Der zerbrochne Krug - Heinrich von Kleist
  2. Woyzeck - Georg Büchner
  3. Der Biberpelz - Gerhart Hauptmann
  4. Heimsuchung - Jenny Erpenbeck

Abitur Gerichtskomödie; soziales Drama um Ausbeutung/Armut; Komödie/Satire um Diebstahl und Obrigkeit; Roman über Erinnerungsräume und Umbrüche.

Bremen

Abitur

  1. Nach Mitternacht - Irmgard Keun
  2. Mario und der Zauberer - Thomas Mann
  3. Emilia Galotti - Gotthold Ephraim Lessing oder Miss Sara Sampson - Gotthold Ephraim Lessing

Abitur Roman in der NS-Zeit (Alltag, Anpassung, Angst); Novelle über Verführung/Massenpsychologie; bürgerliche Trauerspiele (Moral, Macht, Stand).

Hamburg

Abitur

  1. Der zerbrochne Krug - Heinrich von Kleist
  2. Das kunstseidene Mädchen - Irmgard Keun

Abitur Justiz-/Machtkritik als Komödie; Großstadtroman der Weimarer Zeit (Rollenbilder, Aufstiegsträume, soziale Realität).

Hessen

Abitur

  1. Der zerbrochne Krug - Heinrich von Kleist
  2. Woyzeck - Georg Büchner
  3. Heimsuchung - Jenny Erpenbeck
  4. Der Prozess - Franz Kafka

Abitur Gerichtskomödie; Fragmentdrama über Gewalt/Entmenschlichung; Erinnerungsroman über deutsche Brüche; moderner Roman über Schuld, Macht und Bürokratie.

Niedersachsen

Abitur

  1. Der zerbrochene Krug - Heinrich von Kleist
  2. Das kunstseidene Mädchen - Irmgard Keun
  3. Die Marquise von O. - Heinrich von Kleist
  4. Über das Marionettentheater - Heinrich von Kleist

Abitur Schwerpunkt auf Drama/Roman sowie Kleist-Prosatext und Essay (Ehre, Gewalt, Unschuld; Ästhetik/„Anmut“).

Nordrhein-Westfalen

Abitur

  1. Der zerbrochne Krug - Heinrich von Kleist
  2. Heimsuchung - Jenny Erpenbeck

Abitur Komödie über Wahrheit und Autorität; Roman als literarische „Geschichtsschichtung“ an einem Ort.

Saarland

Abitur

  1. Heimsuchung - Jenny Erpenbeck
  2. Furor - Lutz Hübner und Sarah Nemitz
  3. Bahnwärter Thiel - Gerhart Hauptmann

Abitur Erinnerungsroman an einem Ort; zeitgenössisches Drama über Eskalation/Populismus; naturalistische Novelle (Pflicht/Überforderung/Abgrund).

Sachsen (berufliches Gymnasium)

Abitur

  1. Der zerbrochne Krug - Heinrich von Kleist
  2. Woyzeck - Georg Büchner
  3. Irrungen, Wirrungen - Theodor Fontane
  4. Der gute Mensch von Sezuan - Bertolt Brecht
  5. Heimsuchung - Jenny Erpenbeck
  6. Der Trafikant - Robert Seethaler

Abitur Mischung aus Klassiker-Drama, sozialem Drama, realistischem Roman, epischem Theater und Gegenwarts-/Erinnerungsroman; zusätzlich Coming-of-age im historischen Kontext.

Sachsen-Anhalt

Abitur

  1. (keine fest benannte landesweite Pflichtlektüre veröffentlicht; Themenfelder)

Abitur Schwerpunktsetzung über Themenfelder (u. a. Literatur um 1900; Sprache in politisch-gesellschaftlichen Kontexten), ohne feste Einzeltitel.

Schleswig-Holstein

Abitur

  1. Der zerbrochne Krug - Heinrich von Kleist
  2. Heimsuchung - Jenny Erpenbeck

Abitur Recht/Gerechtigkeit und historische Tiefenschichten eines Ortes – umgesetzt über Drama und Gegenwartsroman.

Thüringen

Abitur

  1. (keine fest benannte landesweite Pflichtlektüre veröffentlicht; Orientierung am gemeinsamen Aufgabenpool)

Abitur In der Praxis häufig Orientierung am gemeinsamen Aufgabenpool; landesweite Einzeltitel je nach Vorgabe/Handreichung nicht einheitlich ausgewiesen.

Mecklenburg-Vorpommern

Abitur

  1. (Quelle aktuell technisch nicht abrufbar; Beteiligung am gemeinsamen Aufgabenpool bekannt)

Abitur Land beteiligt sich am länderübergreifenden Aufgabenpool; konkrete, veröffentlichte Einzeltitel konnten hier nicht ausgelesen werden.

Rheinland-Pfalz

Abitur

  1. (keine landesweit einheitliche Pflichtlektüre; schulische Auswahl)

Abitur Keine landesweite Einheitsliste; Auswahl kann schul-/kursbezogen erfolgen.




aiMOOCs



aiMOOC Projekte












THE MONKEY DANCE




The Monkey DanceaiMOOCs

  1. Trust Me It's True: #Verschwörungstheorie #FakeNews
  2. Gregor Samsa Is You: #Kafka #Verwandlung
  3. Who Owns Who: #Musk #Geld
  4. Lump: #Trump #Manipulation
  5. Filth Like You: #Konsum #Heuchelei
  6. Your Poverty Pisses Me Off: #SozialeUngerechtigkeit #Musk
  7. Hello I'm Pump: #Trump #Kapitalismus
  8. Monkey Dance Party: #Lebensfreude
  9. God Hates You Too: #Religionsfanatiker
  10. You You You: #Klimawandel #Klimaleugner
  11. Monkey Free: #Konformität #Macht #Kontrolle
  12. Pure Blood: #Rassismus
  13. Monkey World: #Chaos #Illusion #Manipulation
  14. Uh Uh Uh Poor You: #Kafka #BerichtAkademie #Doppelmoral
  15. The Monkey Dance Song: #Gesellschaftskritik
  16. Will You Be Mine: #Love
  17. Arbeitsheft
  18. And Thanks for Your Meat: #AntiFactoryFarming #AnimalRights #MeatIndustry


© The Monkey Dance on Spotify, YouTube, Amazon, MOOCit, Deezer, ...



Text bearbeiten Bild einfügen Video einbetten Interaktive Aufgaben erstellen

Teilen Facebook Twitter Google Mail an MOOCit Missbrauch melden Zertifikat beantragen


0.00
(0 Stimmen)



Sponsoren, Förderer, Kooperationspartner








Children for a better world >> Förderung der AI Fair-Image Challenge

Fair-Image wird von CHILDREN JUGEND HILFT! gefördert und ist mit der deutschlandweiten AI Fair-Image Challenge SIEGERPROJEKT 2025. Alle Infos zur Challenge hier >>. Infos zum Camp25 gibt es hier. Wenn auch Ihr Euch ehrenamtlich engagiert und noch finanzielle Unterstützung für Eurer Projekt braucht, dann stellt gerne einen Antrag bei JUGEND HILFT.