Heidelberger Akademie der Wissenschaften [Editor]: Jahrbuch ... / Heidelberger Akademie der Wissenschaften: Jahrbuch 2022 (2023)

Metadaten

Heidelberger Akademie der Wissenschaften [Editor]
Jahrbuch ... / Heidelberger Akademie der Wissenschaften: Jahrbuch 2022 — 2023

DOI chapter:

A. Das akademische Jahr 2022

https://doi.org/10.11588/diglit.67410.4

DOI chapter:

II. Wissenschaftliche Vorträge

https://doi.org/10.11588/diglit.67410.12

DOI article:

Brox, Thomas: Wie Deep Learning die Bildbearbeitung verändert hat

https://doi.org/10.11588/diglit.67410.13

DOI Page / Citation link:

https://doi.org/10.11588/diglit.67410#0039

License: Free access - all rights reserved

Facsimile

2 cm

OCR fulltext

Information about OCR text

Thomas Brox

Abb. 1: Hunde können sehr unterschiedlich aussehen.

Deep Learning lieferte nun eine Lösung für dieses Problem, indem es das
Problem nicht in einem einzigen Schritt versucht zu lösen, sondern in mehreren
Schritten. Anstatt universelle Merkmale zu definieren, baut ein tiefes Netzwerk
eine Hierarchie von Merkmalen, die von einer Stufe zur nächsten rekombiniert
werden können. So gelangt man von den Rohdaten eines Bildes Schritt für Schritt
zu der abstrakten Beschreibung des Bildinhalts. Aufgrund der hohen Komplexität
dieser Merkmalshierarchie, insbesondere nach der mehrfachen Rekombination, ist
das Ganze jedoch zum Scheitern verurteilt, wenn man versucht, die Merkmale wie
bisher manuell zu definieren. Mindestens genauso wichtig wie die Hierarchie und
die Rekombination ist es, die Merkmale aus Daten zu lernen. Das Netzwerk be-
steht aus einigen Millionen Parametern, die nun automatisch so bestimmt werden,
dass auf einer großen Zahl von Trainingsbeispielen das richtige Ergebnis produ-
ziert wird. Ich definiere also nicht mehr die Merkmale selbst, sondern diese wer-
den durch die Trainingsdaten und die Kostenfunktion definiert. Die Qualität der
Ergebnisse hängt ganz entscheidend von den Daten ab, die ich dem System zum
Lernen gebe. Mit diesem Konzept konnte man in den vergangenen Jahren sehr
große Fortschritte erzielen. ImageNet zeigt Bilder von 1000 verschiedenen Klas-
sen. Vor Deep Learning waren nur 50 % der Antworten richtig. Mit Deep Learning
gab es einen großen Sprung und durch weitere Verbesserungen in der Technik sind
inzwischen weniger als 10 % der Ergebnisse falsch. Auf etwas einfacheren Daten-
sätzen bekommt man Ergebnisse, die nahe bei 100 % korrekter Antworten liegen,
und entsprechend ist die Bildklassifikation praxistauglich geworden.

39

User-defined Attributes

⛔ ⚠

Save draft

Existing Drafts

Drafts for this annotation (`0`)

Drafts for the same page (`0`)

Drafts for different books/pages (`0`)

Templates (`0`)

Cite this page

Feedback

Save draft

Drafts for this annotation (0)

Drafts for the same page (0)

Drafts for different books/pages (0)

Templates (0)

Drafts for this annotation (`0`)

Drafts for the same page (`0`)

Drafts for different books/pages (`0`)

Templates (`0`)