Heidelberger Akademie der Wissenschaften [Hrsg.]: Jahrbuch ... / Heidelberger Akademie der Wissenschaften: Jahrbuch 2022 (2023)

Metadaten

Heidelberger Akademie der Wissenschaften [Hrsg.]
Jahrbuch ... / Heidelberger Akademie der Wissenschaften: Jahrbuch 2022 — 2023

DOI Kapitel:

A. Das akademische Jahr 2022

https://doi.org/10.11588/diglit.67410.4

DOI Kapitel:

II. Wissenschaftliche Vorträge

https://doi.org/10.11588/diglit.67410.12

DOI Artikel:

Brox, Thomas: Wie Deep Learning die Bildbearbeitung verändert hat

https://doi.org/10.11588/diglit.67410.13

DOI Seite / Zitierlink:

https://doi.org/10.11588/diglit.67410#0039

Lizenz: Freier Zugang - alle Rechte vorbehalten

Faksimile

2 cm

OCR-Volltext

Hinweise zum OCR-Text

Thomas Brox

Abb. 1: Hunde können sehr unterschiedlich aussehen.

Deep Learning lieferte nun eine Lösung für dieses Problem, indem es das
Problem nicht in einem einzigen Schritt versucht zu lösen, sondern in mehreren
Schritten. Anstatt universelle Merkmale zu definieren, baut ein tiefes Netzwerk
eine Hierarchie von Merkmalen, die von einer Stufe zur nächsten rekombiniert
werden können. So gelangt man von den Rohdaten eines Bildes Schritt für Schritt
zu der abstrakten Beschreibung des Bildinhalts. Aufgrund der hohen Komplexität
dieser Merkmalshierarchie, insbesondere nach der mehrfachen Rekombination, ist
das Ganze jedoch zum Scheitern verurteilt, wenn man versucht, die Merkmale wie
bisher manuell zu definieren. Mindestens genauso wichtig wie die Hierarchie und
die Rekombination ist es, die Merkmale aus Daten zu lernen. Das Netzwerk be-
steht aus einigen Millionen Parametern, die nun automatisch so bestimmt werden,
dass auf einer großen Zahl von Trainingsbeispielen das richtige Ergebnis produ-
ziert wird. Ich definiere also nicht mehr die Merkmale selbst, sondern diese wer-
den durch die Trainingsdaten und die Kostenfunktion definiert. Die Qualität der
Ergebnisse hängt ganz entscheidend von den Daten ab, die ich dem System zum
Lernen gebe. Mit diesem Konzept konnte man in den vergangenen Jahren sehr
große Fortschritte erzielen. ImageNet zeigt Bilder von 1000 verschiedenen Klas-
sen. Vor Deep Learning waren nur 50 % der Antworten richtig. Mit Deep Learning
gab es einen großen Sprung und durch weitere Verbesserungen in der Technik sind
inzwischen weniger als 10 % der Ergebnisse falsch. Auf etwas einfacheren Daten-
sätzen bekommt man Ergebnisse, die nahe bei 100 % korrekter Antworten liegen,
und entsprechend ist die Bildklassifikation praxistauglich geworden.

39

Benutzerdefinierte Attribute

⛔ ⚠

Entwurf speichern

Vorhandene Entwürfe

Entwürfe zur aktuellen Annotation (`0`)

Entwürfe zur aktuellen Seite (`0`)

Entwürfe zu anderen Bänden/Seiten (`0`)

Vorlagen (`0`)

Zitieren dieser Seite

Feedback

Entwurf speichern

Entwürfe zur aktuellen Annotation (0)

Entwürfe zur aktuellen Seite (0)

Entwürfe zu anderen Bänden/Seiten (0)

Vorlagen (0)

Entwürfe zur aktuellen Annotation (`0`)

Entwürfe zur aktuellen Seite (`0`)

Entwürfe zu anderen Bänden/Seiten (`0`)

Vorlagen (`0`)