Anfang
Im letzten Kapitel haben wir von Verfahren gehört, mit denen eine datenbasierte KI entwickelt werden kann: Das maschinelle Lernen (englisch “machine learning”).
Maschinelles Lernen sind Verfahren, mit denen man Muster in Daten finden kann und aus diesen etwas lernen kann. Das Gelernte wird dann von einer datenbasierten KI genutzt, um eine bestimmte Aufgabe zu erfüllen. Den Vorgang des Lernens nennt man Training. Oder anders gesagt: Die KI wird mit Daten trainiert.
Maschinelles Lernen kann in drei Teilbereiche unterteilt werden:
- Unüberwachtes Lernen (englisch “unsupervised learning”)
- Überwachtes Lernen (englisch “supervised learning”)
- Verstärkendes Lernen (englisch “reinforcement learning”)
Wir werden uns in diesem Kapitel die Methode überwachtes Lernen genauer anschauen am Beispiel der Bewertung von Muttermalen. Nach einer kurzen Einführung des Ablaufs folgt ein praktischer Teil, bei dem wir eine eigene KI trainieren werden. Dabei lernen wir nicht nur, wie maschinelles Lernen in der Umsetzung ablaufen kann, sondern werden auch Erkenntnisse gewinnen über die Möglichkeiten und Grenzen von KI.
Die zwei anderen Formen von maschinellem Lernen (unüberwachtes Lernen & verstärkendes Lernen) und andere Anwendungsbereiche von KI im Bereich Gesundheit & Pflege werden wir im nächsten Kapitel kennenlernen.
Wie funktioniert überwachtes maschinelles Lernen?
Im ersten Kapitel haben wir bereits eine KI kennengelernt, die mithilfe von überwachtem maschinellem Lernen trainiert wurde, um ihre Aufgabe bewältigen zu können. Zur Erinnerung:
Bewertung von Leberflecken
Der KI wird ein Foto von einem Leberfleck gezeigt und diese gibt daraufhin eine Bewertung ab, wie bedenklich die Form und Farbe ist und ob es sich um ein Anzeichen von Hautkrebs handeln könnte.
Diese KI hat aus einem großen Datensatz gelernt, wie man “bedenkliche” und “unbedenkliche” Leberflecke voneinander unterscheiden kann. Dafür hat man ihr ganz viele Beispiele von bedenklichen und unbedenklichen Leberflecken gezeigt und während dem Training wurde gelernt, wie man diese voneinander unterscheiden kann. Sie zählt also zu den datenbasierten KIs.
Anhand von diesem Beispiel wollen wir uns jetzt genauer anschauen, wie überwachtes maschinelles Lernen abläuft.
Wo ist das Wissen der KI? Wie wird es genutzt?
Während dem Training lernt die KI, wie sie Muttermale richtig bewerten kann. Dafür muss sie in irgendeiner Form Wissen abspeichern, auf deren Grundlage dann später entschieden wird, welche Bewertung zurückgegeben wird.
" In welcher Form ist das Wissen innerhalb der KI repräsentiert? Wie wird dieses Wissen genutzt, um eine Bewertung abzugeben? "
In diesem Abschnitt gehen wir auf eine häufige Form der Wissensrepräsentation ein namens künstliche neuronale Netzwerke. Es gibt allerdings auch noch andere Formen.
Zunächst einmal führen wir einen neuen Begriff ein: Das Modell ist das Ergebnis, welches wir nach dem Training bekommen. Es modelliert ein bestimmtes Verhalten. In unserem Beispiel: Das Bewerten von Leberflecken.
Das Modell besitzt Eingaben (oben) und Ausgaben (unten). Welche und wie viele ist abhängig davon, was das Modell tut. In unserem Beispiel würde das Modell als Eingabe ein Bild von einem Leberfleck bekommen und uns als Ausgabe eine Bewertung in “bedenklich” & “unbedenklich” zurückgeben.
Unter dem Modell beim maschinellen Lernen versteht man nur den Teil eines Systems, der aus Daten gelernt hat. Ein Modell ist oft ein Teil von einem KI-System, welches noch viele andere Bestandteile hat. Zum Beispiel kann die Ausgabe des Modells genutzt werden, um etwas zu steuern. Das wäre dann nicht mehr Teil des Modells, aber immer noch Teil des KI-Systems.
Ein Bild liegt im Computer als zweidimensionales Raster an Farbwerten vor. Das bedeutet, das Modell bekommt genauer betrachtet jeden einzelnen Bildpunkt (auch Pixel genannt) im Bild als eigene Eingabe. Für ein Bild mit einer Auflösung von 256x256 wären das also 65536 Eingaben.
Die Ausgabe dagegen kann durch einen einzelnen Wert zwischen 0% und 100% realisiert werden, wobei ein Wert näher an 0% eher “unbedenklich” bedeutet und ein Wert näher an 100% eher “bedenklich” bedeutet. Dadurch kann das Modell auch Unsicherheit ausdrücken, indem es einen Wert näher an 50% zurückgibt.
Innerhalb des Modells werden alle Eingabewerte (also alle Farbwerte der Pixel) in einer großen Berechnung miteinander verrechnet. Das Ergebnis der Berechnung liefert den Ausgabewert, welcher in diesem Fall ein Wert zwischen 0% und 100% ist. Je näher die Ausgabe an 0% ist, desto mehr schätzt das Modell den Leberfleck als “unbedenklich” ein. Umgekehrt stehen Werte näher an 100% für “bedenklich”.
Diese Berechnungsformeln sind in der Regel sehr lang und der in der Grafik gezeigte Ausschnitt ist nur ein verschwindend kleiner Bruchteil. Neben Addition und Multiplikation kommen auch noch andere Rechenoperationen vor, die hier nicht gezeigt sind.
Schaut man sich die Berechnung im Modell genauer an, findet man neben den Eingabewerten auch eine große Anzahl an Parametern. Parameter sind Werte in der Berechnungsformel, die man anpassen kann. Indem man diese Parameter verändert, ändert sich auch die Berechnung und damit das Ergebnis der Berechnung für ein bestimmtes Bild.
Das bedeutet:
Das Verhalten des Modells kann über die Parameter angepasst werden.
Ob unser Modell nun einen Leberfleck als bedenklich oder unbedenklich bewertet, hängt von den Werten dieser Parameter ab. Also kann man sagen:
Beim maschinellen Lernen steckt das Wissen in den Werten der Parameter des Modells.
Über die Parameter kann auf vielfältige Art und Weise gesteuert werden, worauf das Modell achtet. Würde man zum Beispiel die Parameter so wählen, dass Farbwerte an den Rändern des Bildes mit null multipliziert werden, dann hätten die Farbwerte an den Rändern keinen Einfluss auf das letztendliche Ergebnis. Also das Modell würde demnach nicht darauf achten, was im Randbereich der Bilder zu sehen ist.
Über die Parameter können allerdings auch komplexere Merkmale erkannt werden, wie zum Beispiel die Kanten unserer Leberflecke. Wechseln die Farbwerte schlagartig, wenn man zum Beispiel erst einen hohen Wert (helle Hautfarbe) und ein paar Pixel weiter einen niedrigen Wert (dunkle Farbe des Muttermals) hat, kann ein großer Parameterwert an der richtigen Stelle in der Berechnung dafür sorgen, dass das Ergebnis von dem Vorhandensein einer solchen Kante anhängt.
Es mag vielleicht schwer vorstellbar sein, dass es möglich ist, durch solch eine Formel ein Verhalten wie die Erkennung und Bewertung von Leberflecken umzusetzen. Allerdings ist diese Formel, wenn man sie aufschreiben würde, sehr lang und in ihrer Länge und über eine große Anzahl an Parametern lassen sich auch komplexere Aufgaben wie diese durch eine Berechnung lösen.
Das Ziel beim überwachten maschinellem Lernen ist es, geeignete Werte für die Modell-Parameter zu finden und damit ein gewünschtes Verhalten zu erreichen.
Bei der Entwicklung mit maschinellem Lernen wird nicht für jede KI-Anwendung eine komplett eigene Berechnungsformel von Grund auf neu erstellt. Stattdessen gibt es Vorlagen für diese internen Berechnungsstrukturen, die dann über die Parameter so angepasst werden, dass sie eine gewünschte Aufgabe erfüllen. Eine wichtige Aufgabe für die EntwicklerInnen beim maschinellen Lernen ist es, eine geeignete Vorlage auszuwählen.
Die Struktur der Berechnungsformel ist unter anderem bestimmt durch eine vernetzte Struktur, die man künstliche neuronale Netzwerke nennt. Dieser Begriff könnte dir eventuell bereits vertraut sein. In diesen Lernmaterialien gehen wir nicht weiter darauf ein, wie künstliche neuronale Netzwerke aufgebaut sind, denn für uns reicht es aus zu verstehen, dass diese nur die Struktur für die interne Berechnungsformel vorgeben.
Wie funktioniert das Training des Modells?
Wir wissen jetzt, dass wir die Parameterwerte richtig setzen müssen, damit das Modell in der Lage ist Muttermale zu bewerten. Aber:
" Wie findet man die richtigen Parameterwerte? "
Beim maschinellen Lernen nutzen wir Daten, um das Modell zu trainieren. Während dem Training werden die Parameterwerte innerhalb des Modells angepasst, auf Grundlage dieser Daten.
Die Daten, mit denen das Modell trainiert wird, nennt man Trainingsdaten. Diese zeigen dem Modell, was es lernen soll.
In unserem Beispiel bestehen die Trainingsdaten aus Bildern von Leberflecken und der dazugehörigen Klasse. Das heißt, zu jedem Bild liefern wir auch die Information, ob es sich um einen bedenklichen oder unbedenklichen Leberfleck handelt. Hier eignet es sich Daten aus der Vergangenheit zu nehmen, bei denen sich nach einer Zeit herausgestellt hat, ob es sich tatsächlich um Hautkrebs gehandelt hatte oder nicht. Jedes Bild hätte dann entweder eine Bewertung von 0% (war im Nachhinein kein Hautkrebs) oder 100% (war im Nachhinein ein Anzeichen von Hautkrebs).
Schauen wir uns jetzt Folgendes an:
" Wie ermittelt man aus den Trainingsdaten die Parameterwerte? "
Zunächst werden die Parameter des Modells auf einen Startwert gesetzt, oft sind das zufällige Werte. Gibt man dem Modell jetzt ein Bild als Eingabe bekommt man, was zu erwarten war, eine komplett willkürliche Bewertung als Ausgabe. In diesem Beispiel haben wir ein Bild von einem unbedenklichen Leberfleck und das Modell gibt den Wert 65% (also eine leichte Tendenz zu “bedenklich”) zurück. Allerdings wissen wir für dieses Bild, dass die Ausgabe 0% (also komplett unbedenklich) sein sollte. Man könnte jetzt versuchen, die Werte der Parameter zu verändern, um das Ergebnis zu verbessern.
Um herauszufinden, wie die Parameter verändert werden müssen, nutzt man eine mathematische Methode, die sich Gradientenverfahren nennt. Bei diesem Verfahren wird berechnet in welche “Richtung” (größer oder kleiner) man die Parameterwerte verändern müsste, damit das Ergebnis näher an dem gewünschten Ergebnis liegt. Jetzt verändert man die Parameterwerte einen kleinen Schritt in die jeweilige Richtung (visualisiert über die grünen Pfeile) und erhält eine etwas bessere Ausgabe von 35%.
Das eben beschriebene Verfahren ist ein einzelner Trainingsschritt im Trainingsprozess. Dieser Schritt wird anschließend mit weiteren Bildern aus dem Trainingsdatensatz wiederholt. So werden die Parameterwerte stückweise immer weiter angepasst.
Während dem Trainingsprozess wird dem Modell hintereinander jedes Bild aus den Trainingsdaten als Eingabe gegeben und folgende Schritte ausgeführt:
- Die Ausgabe des Modells wird verglichen mit der gewünschten Ausgabe.
- Über das Gradientenverfahren erhält man für dieses Eingabebild eine “Richtung” in die man die Modell-Parameter ändern kann, um die Ausgabe zu verbessern.
- Die Modell-Parameter werden um einen Schritt in diese “Richtung” verändert.
Nachdem alle Bilder des Trainingsdatensatzes diesen Prozess durchlaufen haben, glaubst du, dass das Modell jetzt funktioniert?
Deine Eingaben werden nicht gespeichert und an keinen Server geschickt. Diese Aufgaben sollen dir nur beim Lernen helfen.
Nimm dir ein wenig Zeit für die Aufgabe. Wenn du fertig bist, klicke auf 'Weiter'.
Nachdem alle Bilder aus dem Trainingsdatensatz einmal für das Training genutzt wurden, kann es immer noch sein, dass das Modell nicht so funktioniert, wie wir uns es wünschen. Oft nutzt man deshalb dieselben Trainingsdaten erneut in mehreren Durchläufen, bis sich die Parameterwerte stabilisieren und bei neuen Durchläufen nicht mehr stark verändern.
Aber auch nach mehreren Durchläufen kann es sein, dass das Modell nicht wie gewünscht funktioniert. Das kann eine Vielzahl an Gründen haben. Zum Beispiel kann es sein, dass die Modellstruktur (also die Berechnungsformel) nicht genug Freiraum bietet, diese Aufgabe lösen zu können. Dann könnte man es mit einer anderen Modellstruktur erneut versuchen. Neben dieser Ursache gibt es aber noch eine Vielzahl an anderen Gründen, auf die wir nicht im Detail eingehen.
Nehmen wir an, dass wir nach dem Training sehen, dass unser Modell die Trainingsdaten richtig bewerten kann. Allerdings wollen wir von dem Modell Bewertungen für neue und noch ungesehene Muttermale. Glaubst du, dass das Modell auch für solche Muttermale eine richtige Bewertung liefert? Wie könnte man das überprüfen?
Deine Eingaben werden nicht gespeichert und an keinen Server geschickt. Diese Aufgaben sollen dir nur beim Lernen helfen.
Nimm dir ein wenig Zeit für die Aufgabe. Wenn du fertig bist, klicke auf 'Weiter'.
Es kann passieren, dass das Modell jetzt auch neue und ungesehene Bilder richtig bewertet. Das würde bedeuten, es hat gelernt auf Merkmale wie eine asymmetrische Form zu achten. Allerdings kann es auch passieren, dass neue Bilder nicht richtig bewertet werden. Statt auf allgemeine Merkmale über verschiedene Bilder hinweg, kann das Modell zum Beispiel auch die Trainingsdaten sozusagen “auswendig gelernt” haben. Das bezeichnet man als Overfitting.
Um zu überprüfen, ob das Modell etwas lernt, was auch für neue Eingaben nützlich ist, nutzt man einen weiteren Datensatz, den man Testdaten nennen. Genauso wie bei den Trainingsdaten, sind diese Bilder ebenfalls schon bewertet, werden allerdings nicht für den Trainingsprozess genutzt. Sie dienen dazu, das Verhalten des Modells am Ende zu testen.
Schafft es das Modell Bilder aus den Testdaten richtig zu bewerten, wissen wir, das Modell hat im Trainingsprozess etwas gelernt, mit dem auch neue, bisher ungesehene Bilder von Leberflecken bewertet werden können. Kann es dagegen nur die Trainingsdaten richtig bewerten und versagt bei den Testdaten, hat es vermutlich lediglich die Trainingsdaten “auswendig gelernt”, aber nicht “verstanden” auf welche Eigenschaften es achten soll.
Trainiere selbst ein Modell zur Bewertung von Leberflecken
Jetzt kommen wir zum praktischen Teil und werden ein eigenes Modell trainieren und testen. Dabei werden wir tiefgreifender verstehen, wie maschinelles Lernen funktioniert und welche Probleme beim Training auftreten können. Darüber hinaus hilft uns dieser Einblick auch dabei besser abschätzen zu können, wie wir KI im Bereich Gesundheit & Pflege sinnvoll einsetzen können.
Unser Modell trainieren wir auf der Webseite Teachable Machine. Teachable Machine vereinfacht den Prozess ein eigenes Modell zu trainieren für uns deutlich: Viele technische Details sind verborgen, es ist keine Programmiererfahrung notwendig und die Menge an Trainingsdaten ist geringer, da bereits ein vortrainiertes Modell zugrunde liegt.
Teachable Machine eignet sich nicht für jede erdenkliche Entwicklung mit maschinellem Lernen. In der Praxis wird häufig in einer Programmiersprache wie Python und mithilfe von Software-Libraries wie beispielsweise TensorFlow gearbeitet. Trotzdem ist Teachable Machine ein nützliches Werkzeug, um maschinelles Lernen zu verstehen und die trainierten Modelle können anschließend heruntergeladen und für Projekte genutzt werden.
Teachable Machine nutzen
Bevor wir uns an die eigentliche Aufgabe, dem Bewerten von Leberflecken, machen, schauen wir uns an einem Beispielprojekt an, wie man mit Teachable Machine arbeiten.
Nimm dir ein wenig Zeit für die Aufgabe. Wenn du fertig bist, klicke auf 'Weiter'.
Gehe auf die Teachable Machine Webseite, klicke auf Bestehendes Projekt aus einer Datei öffnen und wähle dort das Beispielprojekt aus.
Nimm dir ein wenig Zeit für die Aufgabe. Wenn du fertig bist, klicke auf 'Weiter'.
Es sollte jetzt folgende Oberfläche sichtbar sein:
Klicke auf Modell trainieren und bleibe so lange im selben Browser-Tab, bis das Modell fertig trainiert ist.
Nimm dir ein wenig Zeit für die Aufgabe. Wenn du fertig bist, klicke auf 'Weiter'.
Erlaube der Webseite, deine Kamera zu benutzen, wenn danach gefragt wird. Eventuell wirst du aber auch nicht gefragt.

Nimm dir ein wenig Zeit für die Aufgabe. Wenn du fertig bist, klicke auf 'Weiter'.
Jetzt solltest du das Bild deiner Webcam sehen.
Wie dir eventuell schon aufgefallen ist, bewertet dieses Modell (noch) keine Muttermale. Stattdessen versucht dieses Modell die Buchstaben U und V zu erkennen. Mit diesem Modell können wir jetzt erst einmal etwas herumprobieren und Teachable Machine kennenlernen. Im Anschluss trainieren wir dann ein Modell zur Bewertung von Leberflecken.
Nimm dir ein Stück Papier, zeichne ein paar Buchstaben U und V darauf und halte sie in die Webcam. Unter dem Bild der Webcam siehst du das Ergebnis.
Was fällt dir auf?
Deine Eingaben werden nicht gespeichert und an keinen Server geschickt. Diese Aufgaben sollen dir nur beim Lernen helfen.
Nimm dir ein wenig Zeit für die Aufgabe. Wenn du fertig bist, klicke auf 'Weiter'.
Das Modell sollte in der Lage gewesen sein, einige U und V voneinander zu unterscheiden. Allerdings ist sich das Modell vermutlich bei einigen Eingaben unsicher gewesen und schwankte zwischen U und V. Vielleicht hast du es auch geschafft, eine Zeichnung zu erstellen, die zuverlässig falsch eingeordnet wurde.
Es ist außerdem auffällig, dass das Modell permanent eine Ausgabe liefert, egal ob man gerade eine Zeichnung präsentiert oder nur der Hintergrund der Webcam zu sehen ist. Es hilft, sich in Erinnerung zu rufen, dass das Modell für jedes Eingabebild eine Formel berechnet. Diese wird in diesem Fall mehrmals pro Sekunde berechnet, egal was auf dem Bild zu sehen ist.
Auf der linken Seite siehst du die zwei Kategorien (hier Klassen genannt), die wir unterscheiden: Der Buchstabe V und der Buchstabe U. Außerdem siehst du hier auch die jeweiligen Trainingsdaten, mit denen das Modell trainiert wurde.
Versuche ein Symbol zu zeichnen, bei dem die KI nicht klar unterscheiden kann, ob es sich um ein V oder ein U handelt. Du kannst dir dafür die Trainingsdaten genauer anschauen und überlegen, welche Form “zwischen” einem V oder U Symbol liegen könnte.
Nimm dir ein wenig Zeit für die Aufgabe. Wenn du fertig bist, klicke auf 'Weiter'.
Vielleicht hast du ein Symbol gefunden, welches unten zwischen rund (wie beim U) und eckig (wie beim V) liegt und hast damit die KI täuschen können. Solch ein Symbol ist vermutlich oft auch für einen Menschen nicht ganz eindeutig. Es lassen sich allerdings auch noch andere Beispiele finden, wie zum Beispiel dieses hier, welches wir eindeutig als V sehen, aber von dem Modell als U interpretiert wird:

Welche Eigenschaft in diesem gezeichneten V könnte das Modell fälschlicherweise als Anzeichen für ein U halten?
Deine Eingaben werden nicht gespeichert und an keinen Server geschickt. Diese Aufgaben sollen dir nur beim Lernen helfen.
Nimm dir ein wenig Zeit für die Aufgabe. Wenn du fertig bist, klicke auf 'Weiter'.
Vielleicht achtet das Modell weniger auf einen spitzen Zulauf unten (wie anfangs angenommen), sondern auf die Krümmung der zwei Linien.
Eine Krümmung aufeinander zu wird vermutlich eher als U bewertet. Gerade Linien oder eine Krümmung voneinander weg, eher als V.
Es wäre hilfreich, wenn man einen Blick ins Modell werfen könnte, um herauszufinden, worauf genau das Modell achtet. Das Problem ist nur, dass wir dort keine klaren Regeln vorfinden, sondern eine lange Berechnungsformel mit zahlreichen Parametern, die für uns Menschen größtenteils nicht erklärt, worauf die KI achtet. Das bezeichnet man oft auch als Problem der Erklärbarkeit bei datenbasierter KI. Wissensbasierte KI dagegen arbeitet mit Wissen, welches vom Menschen kommt und ist dadurch deutlich leichter zu verstehen.
Aus dieser Beobachtung wollen wir uns mitnehmen:
Ein Modell muss nach dem Training mit möglichst vielfältigen Eingaben getestet werden. Nur dadurch stellt sich heraus, ob das Modell auch auf die Merkmale achtet, die man beabsichtigt hat.
Bewertung von Leberflecken
Nachdem wir jetzt mit Teachable Machines vertraut sind, werden wir in diesem Abschnitt ein neues Modell trainieren, mit dem Leberflecke bewertet werden können.
Erinnern wir uns an eines der Merkmale von Leberflecken, welches auf eine bösartige Variante hindeuten könnte: Eine asymmetrische Form.


















Quelle: International Skin Imaging Collaboration
Die Form allein ist oft allerdings nicht ausschlaggebend! Auch bösartige Varianten können eine symmetrische Form haben und gutartige eine asymmetrische. Trotzdem ist die Form ein wichtiger Faktor bei der Bewertung und zur Vereinfachung konzentrieren wir uns erstmal nur auf die Form.
Statt mit Bildern von echten Leberflecken zu arbeiten, werden wir “Leberflecke” mit einem Stift auf Papier aufmalen. Dadurch können wir uns beliebig viele Trainingsdaten selbst erstellen, einfacher herumexperimentieren und schneller zu einem trainierten Modell kommen.
Beispiele für gezeichnete Muttermale
Links: Eher asymmetrische Formen, die als bedenklich gelten sollten.
Rechts: Eher symmetrische Formen, die als unbedenklich gelten sollten.

Nimm dir ein wenig Zeit für die Aufgabe. Wenn du fertig bist, klicke auf 'Weiter'.
Benenne die zwei Klassen auf der linken Seite um in Unbedenklich und Bedenklich indem du auf den Stift neben dem Namen klickst.
Nimm dir ein wenig Zeit für die Aufgabe. Wenn du fertig bist, klicke auf 'Weiter'.
Alle weiteren Einstellungen kannst du so belassen und wir werden als Nächstes ein paar Trainingsdaten hinzufügen. Zuerst fügen wir ein Bild zur Kategorie Unbedenklich hinzu:
- Klicke im Block Unbedenklich auf Webcam.
Nimm dir ein wenig Zeit für die Aufgabe. Wenn du fertig bist, klicke auf 'Weiter'.
- Erlaube der Webseite die Benutzung deiner Webcam, wenn danach gefragt wird. Eventuell wirst du aber auch nicht gefragt.
Falls ein anderes Programm oder ein anderer Browser-Tab gerade deine Webcam benutzt, kann es zu Problemen kommen. Oft hilft es dann alle diese anderen Anwendungen oder Browser-Tabs zu schließen.
Nimm dir ein wenig Zeit für die Aufgabe. Wenn du fertig bist, klicke auf 'Weiter'.
Jetzt solltest du wieder das aktuelle Bild deiner Webcam sehen.
- Zeichne einen unbedenklichen Leberfleck.
Zur Erinnerung: Unbedenkliche Leberflecke haben eine eher symmetrische Form.
Nimm dir ein wenig Zeit für die Aufgabe. Wenn du fertig bist, klicke auf 'Weiter'.
- Halte deine Zeichnung in die Webcam und achte dabei darauf, dass das Muttermal deutlich zu erkennen ist. Bestenfalls hältst du die Zeichnung so nah heran, dass das Muttermal halb so groß erscheint wie das gesamte Bild. Allerdings kann es passieren, dass die Webcam kein scharfes Bild mehr macht auf diese kurze Distanz. Dann lieber etwas weiter weg gehen.
Sobald du eine gute Distanz gefunden hast, klicke Zum Aufnehmen halten.
Nimm dir ein wenig Zeit für die Aufgabe. Wenn du fertig bist, klicke auf 'Weiter'.
Auf der rechten Seite sollten ein oder mehrere Bilder erscheinen von deiner Zeichnung.
- Lösche Bilder, die doppelt vorkommen.
Nimm dir ein wenig Zeit für die Aufgabe. Wenn du fertig bist, klicke auf 'Weiter'.
Wiederhole die Schritte 1-5 jetzt so oft, bis du jeweils drei Bilder im Block Unbedenklich und Bedenklich hast.
Klicke danach auf Modell trainieren und warte bis das Training abgeschlossen ist.
Nimm dir ein wenig Zeit für die Aufgabe. Wenn du fertig bist, klicke auf 'Weiter'.
Das war es, jetzt ist dein Modell trainiert. Aktivierst du auf der rechten Seite die Webcam, kannst du das Ergebnis der Berechnung im Modell für das aktuelle Kamerabild sehen.
Wie könntest du jetzt testen, ob das Modell funktioniert?
Deine Eingaben werden nicht gespeichert und an keinen Server geschickt. Diese Aufgaben sollen dir nur beim Lernen helfen.
Nimm dir ein wenig Zeit für die Aufgabe. Wenn du fertig bist, klicke auf 'Weiter'.
Um herauszufinden, ob das Modell funktioniert, reicht es nicht, die Zeichnungen zu testen, die bereits in den Trainingsdaten verwendet wurden. Das Modell wurde auf Grundlage dieser Bilder erstellt und bekam die “korrekte” Bewertung gleich mit dazu. Um das Modell zu testen, zeichnen wir also neue Leberflecke (die Testdaten), die sich von den Trainingsdaten unterscheiden. Werden diese auch richtig bewertet, bedeutet das, das Modell hat nicht nur die Trainingsdaten auswendig gelernt, sondern hat gelernt bestimmte Eigenschaften in den Zeichnungen zu erkennen, die auf “unbedenklich” oder “bedenklich” hindeuten.
Bilder, mit denen das Modell getestet wird, dürfen nicht in den Trainingsdaten vorkommen.
Zeichne jetzt ein paar neue Leberflecke und teste das Modell.
Nimm dir ein wenig Zeit für die Aufgabe. Wenn du fertig bist, klicke auf 'Weiter'.
Vermutlich ist dein Modell in der Lage einige Leberflecke richtig zu bewerten, allerdings werden vermutlich auch viele Leberflecke falsch oder unklar bewertet.
Nimm dir jetzt ein wenig Zeit zum Experimentieren.
Verändere die Trainingsdaten, trainiere das Modell erneut und teste das Modell anschließend.
Wiederhole das Training so oft wie du möchtest und versuche ein Modell zu trainieren, welches zuverlässig richtig bewertet.
Nimm dir ein wenig Zeit für die Aufgabe. Wenn du fertig bist, klicke auf 'Weiter'.
Vielleicht warst du schnell zufrieden mit deinem Modell:
" Mein Modell bewertet all meine Zeichnungen richtig! "
Dann schau dir nochmal die Bilder von gutartigen und bösartigen ‘Muttermalen' an. Versuche die Formen auf Papier zu zeichnen und teste sie mit deinem Modell. Vielleicht findest du Beispiele, bei denen dein Modell noch nicht so gut abschneidet.
Vielleicht hast du dir aber auch Folgendes gedacht:
" Das Modell bewertet immer wieder falsch und ich weiß nicht warum! "
Der Grund, warum sich ein Modell nicht richtig verhält, kann an deinen Trainingsdaten liegen. Hier sind ein paar Tipps, die dir weiterhelfen könnten:
- Könnte es sein, dass dein trainiertes Modell auf Eigenschaften in den Bildern achtet, die du nicht beabsichtigt hast? Zum Beispiel könnte dein Modell darauf achten, wie groß deine Zeichnungen auf den Bildern sind. Sind zum Beispiel die unbedenklich Trainingsdaten generell größer dargestellt als die bedenklich Trainingsdaten, könnte das Modell bei einer größeren Zeichnung auf unbedenklich schließen, unabhängig von einer asymmetrischen Form.
- Hast du “genug” Trainingsdaten? Damit das Modell etwas lernen kann, muss es genug Beispiele in den Trainingsdaten gesehen haben. Versuche mindestens 10 Trainingsdaten für jede Kategorie zu haben.
- Sind deine Formen für unbedenklich und bedenklich zu unterscheiden? Je ähnlicher die Zeichnungen beider Kategorien sind (auch für dich als Mensch), desto schwieriger wird es für das Modell zu unterscheiden. Du kannst versuchen, die Unterschiede deutlicher zu machen. Bedenke dabei allerdings, dass wir uns an reale Leberflecke halten wollen, die nun mal nicht ganz eindeutig unterschiedlich sind.
- Sind die Formen innerhalb einer Klasse zu ähnlich? Deine Trainingsdaten sollten variieren, damit das Modell ein möglichst breites Spektrum “sieht” und lernt nicht nur eine bestimmte Form (z.B. einen Kreis) zu erkennen, sondern eine Eigenschaft wie Symmetrie der Form. Stelle sicher, dass die Formen innerhalb der beiden Klassen genug variieren.
Nimm dir gerne noch einmal Zeit zum Experimentieren mithilfe dieser Tipps.
Nimm dir ein wenig Zeit für die Aufgabe. Wenn du fertig bist, klicke auf 'Weiter'.
Hoffentlich konntest du mithilfe der Tipps ein Modell trainieren, welches halbwegs zuverlässig funktioniert.
Dir ist vermutlich aufgefallen, dass es keine triviale Aufgabe ist, das Modell zu trainieren. Du hast gesehen, wie wichtig das Testen ist. Das gilt auch für andere KI-Entwicklungen, die maschinelles Lernen benutzen:
Was das Modell aus den Daten gelernt hat zu erkennen, muss durch anschließendes Testen herausgefunden werden. Es kann passieren, dass das Modell auf Eigenschaften in der Eingabe achtet, die man nicht beabsichtigt hat.
Außerdem hast du gesehen, dass die KI keinesfalls selbstständig lernt, das Richtige zu tun. Wir mussten an vielen Stellen testen und die Trainingsdaten geschickt auswählen. Wir wollen uns merken:
Eine wichtige und oft umfangreiche Aufgabe beim maschinellen Lernen ist die Auswahl und Verarbeitung von Daten für das Training und Testen des Modells. Für diese Aufgabe wird meistens ein Mensch benötigt.
Wie sieht “reales” maschinelles Lernen aus?
Teachable Machine ist mit eine der einfachsten Methoden ein Modell zu trainieren und hat sich daher gut für diese Lernmaterialien geeignet. Allerdings findet maschinelles Lernen in den meisten Fällen über andere Wege statt. Diese bieten mehr Flexibilität, sind dadurch aber komplizierter und erfordern Kenntnisse im Programmieren.
Die Menge an Trainingsdaten für unser Modell war sehr gering im Vergleich zu “realen” Verfahren. Das war möglich, weil auf Teachable Machine ein bereits vortrainiertes Modell nur noch für das Bewerten von Muttermalen spezialisiert wurde. Typischerweise ist die Anzahl an notwendigen Trainingsdaten deutlich höher.
Unsere gezeichneten Leberflecke sind im Vergleich zu realen Leberflecken deutlich einfacher zu unterscheiden, sowohl für den Menschen als auch für eine KI. Während bei den gezeichneten Leberflecken vorwiegend nur zwei Farben (des Papiers und des Stiftes) präsent waren, sind in Fotos von tatsächlichen Leberflecken deutlich mehr Farben vorhanden. Das erfordert mehr Trainingsdaten, kompliziertere Modelle und mehr Aufwand ein Modell erfolgreich zu trainieren.
Das Verfahren, welches wir hier kennengelernt haben, ist also eine sehr vereinfachte Variante, aber die Bestandteile finden sich auch in anderen Verfahren bei der Entwicklung mit maschinellem Lernen wieder. Uns hat es geholfen, den Prozess und die wichtigen Schritte und Eigenschaften zu verstehen.
Wir sind nicht genauer auf die interne Struktur der Modelle eingegangen oder wie das Gradientenverfahren funktioniert. Zudem wurden auf Teachable Machine viele technische Details verborgen. Für ein grundlegendes Verständnis von KI sind diese Informationen nicht unbedingt notwendig. Falls es dich allerdings interessiert, können wir die Videoserie zu Neural Networks von 3Blue1Brown (mit deutschen Untertiteln) empfehlen. Für die restlichen Kapitel in diesem Kurs sind diese Inhalte allerdings nicht notwendig.
Im nächsten Kapitel beschäftigen wir uns mit der Frage: Was kann KI und was kann KI nicht? Dabei werden wir auch über andere Formen von maschinellem Lernen sprechen und vielfältige Anwendungen von KI im Bereich Gesundheit & Pflege kennenlernen.