Metadaten

Heidelberger Akademie der Wissenschaften [Hrsg.]
Jahrbuch ... / Heidelberger Akademie der Wissenschaften: Jahrbuch 2022 — 2023

DOI Kapitel:
A. Das akademische Jahr 2022
DOI Kapitel:
II. Wissenschaftliche Vorträge
DOI Artikel:
Brox, Thomas: Wie Deep Learning die Bildbearbeitung verändert hat
DOI Seite / Zitierlink: 
https://doi.org/10.11588/diglit.67410#0039
Lizenz: Freier Zugang - alle Rechte vorbehalten
Überblick
Faksimile
0.5
1 cm
facsimile
Vollansicht
OCR-Volltext
Thomas Brox


Abb. 1: Hunde können sehr unterschiedlich aussehen.

Deep Learning lieferte nun eine Lösung für dieses Problem, indem es das
Problem nicht in einem einzigen Schritt versucht zu lösen, sondern in mehreren
Schritten. Anstatt universelle Merkmale zu definieren, baut ein tiefes Netzwerk
eine Hierarchie von Merkmalen, die von einer Stufe zur nächsten rekombiniert
werden können. So gelangt man von den Rohdaten eines Bildes Schritt für Schritt
zu der abstrakten Beschreibung des Bildinhalts. Aufgrund der hohen Komplexität
dieser Merkmalshierarchie, insbesondere nach der mehrfachen Rekombination, ist
das Ganze jedoch zum Scheitern verurteilt, wenn man versucht, die Merkmale wie
bisher manuell zu definieren. Mindestens genauso wichtig wie die Hierarchie und
die Rekombination ist es, die Merkmale aus Daten zu lernen. Das Netzwerk be-
steht aus einigen Millionen Parametern, die nun automatisch so bestimmt werden,
dass auf einer großen Zahl von Trainingsbeispielen das richtige Ergebnis produ-
ziert wird. Ich definiere also nicht mehr die Merkmale selbst, sondern diese wer-
den durch die Trainingsdaten und die Kostenfunktion definiert. Die Qualität der
Ergebnisse hängt ganz entscheidend von den Daten ab, die ich dem System zum
Lernen gebe. Mit diesem Konzept konnte man in den vergangenen Jahren sehr
große Fortschritte erzielen. ImageNet zeigt Bilder von 1000 verschiedenen Klas-
sen. Vor Deep Learning waren nur 50 % der Antworten richtig. Mit Deep Learning
gab es einen großen Sprung und durch weitere Verbesserungen in der Technik sind
inzwischen weniger als 10 % der Ergebnisse falsch. Auf etwas einfacheren Daten-
sätzen bekommt man Ergebnisse, die nahe bei 100 % korrekter Antworten liegen,
und entsprechend ist die Bildklassifikation praxistauglich geworden.

39
 
Annotationen
© Heidelberger Akademie der Wissenschaften