Heidelberger Akademie der Wissenschaften [Hrsg.]
Jahrbuch ... / Heidelberger Akademie der Wissenschaften: Jahrbuch 2022
— 2023
Zitieren dieser Seite
Bitte zitieren Sie diese Seite, indem Sie folgende Adresse (URL)/folgende DOI benutzen:
https://doi.org/10.11588/diglit.67410#0038
DOI Kapitel:
A. Das akademische Jahr 2022
DOI Kapitel:II. Wissenschaftliche Vorträge
DOI Artikel:Brox, Thomas: Wie Deep Learning die Bildbearbeitung verändert hat
DOI Seite / Zitierlink:https://doi.org/10.11588/diglit.67410#0038
- Schmutztitel
- Titelblatt
- 5-10 Inhaltsverzeichnis
-
11-172
A. Das akademische Jahr 2022
-
11-37
I. Jahresfeier am 21. Mai 2022
- 11-12 Begrüßung durch den Präsidenten Bernd Schneidmüller
- 13-15 Grußwort des Präsidenten der Akademie von Athen Antonios Rengakos
- 16-22 Verantwortung und das Prinzip von Wissenschaft. Bericht des Präsidenten
- 23-24 Kurzbericht des Sprechers des WIN-Kollegs Martin Fungisai Gerchen
- 36-37 Verleihung der Preise
-
38-101
II. Wissenschaftliche Vorträge
-
102-172
III. Veranstaltungen
- 102-106 Academy for Future – Klimakrise: Warum müssen wir jetzt handeln? Öffentliche Veranstaltungsreihe der Arbeitsgruppe „Klimakrise“
- 106-108 Akademievorträge. Gemeinsame Vortragsreihe der Heidelberger Akademie der Wissenschaften mit der Württembergischen Landesbibliothek
-
109-121
Mitarbeitervortragsreihe „Wir forschen. Für Sie“
- 126 Internationale Kooperation mit der Estnischen Akademie der Wissenschaften
-
127
Verleihung des Reuchlinpreises 2022 an die Islamwissenschaftlerin Katajun Amirpur
- 147-151 Sebestyén, Ágnes; Weber, Andreas: Netzwerktreffen mit Postdoktorandinnen und Postdoktoranden des Eliteprogramms der Baden-Württemberg Stiftung. 14. und 15. November 2022
-
151-170
Verleihung des Karl-Jaspers-Preises 2022 an den Philosophen Volker Gerhardt
-
11-37
I. Jahresfeier am 21. Mai 2022
- 173-241 B. Die Mitglieder
-
243-356
C. Die Forschungsvorhaben
- 243-244 I. Forschungsvorhaben und Arbeitsstellenleitung
-
245-347
II. Tätigkeitsberichte
- 245-249 1. Deutsche Inschriften des Mittelalters
- 249-255 2. Deutsches Rechtswörterbuch
- 255-262 3. Goethe-Wörterbuch (Tübingen)
- 262-265 4. Melanchthon-Briefwechsel
- 265-270 5. Edition literarischer Keilschrifttexte aus Assur
- 270-278 6. Buddhistische Steinschriften in Nordchina
- 278-293 7. The Role of Culture in Early Expansions of Humans (Frankfurt und Tübingen)
- 294-299 8. Nietzsche-Kommentar (Freiburg)
- 300-309 9. Klöster im Hochmittelalter
- 309-312 10. Der Tempel als Kanon der religiösen Literatur Ägyptens (Tübingen)
- 313-316 11. Kommentierung der Fragmente der griechischen Komödie (Freiburg im Breisgau)
- 317-320 12. Karl-Jaspers-Gesamtausgabe (KJG)
- 320-326 13. Historisch-philologischer Kommentar zur Weltchronik des Johannes Malalas
- 326-333 14. Religions- und rechtsgeschichtliche Quellen des vormodernen Nepal
- 333-339 15. Theologenbriefwechsel im Südwesten des Reichs in der Frühen Neuzeit (1550–1620)
- 339-345 16. Hinduistische Tempellegenden in Südindien
- 345-347 17. Wissensnetze in der mittelalterlichen Romania (ALMA)
- 348-354 III. Drittmittelgeförderte Projekte
- 355-356 IV. Kooperationsprojekte
-
357-434
D. Förderung des wissenschaftlichen Nachwuchses
- 357-372 I. Preise der Akademie
- 373 II. Die Junge Akademie | HAdW
- 374-376 III. Das WIN-Kolleg der Jungen Akademie | HAdW
- 414 IV. Das Akademie-Kolleg der Jungen Akademie | HAdW
-
435-455
E. Anhang
-
435-439
I. Organe, Mitglieder, Institutionen
- 435-436 Vorstand und Geschäftsstelle
- 436 Personalrat / Ombudsperson „Gute wissenschaftliche Praxis“ / Ombudsperson „Partnerschaftliches Miteinander“ / Union der deutschen Akademien der Wissenschaften
- 437 Vertreter der Akademie in Kommissionen der Union / Vertreter der Akademie in anderen wissenschaftlichen Institutionen
- 438 Verein zur Förderung der Heidelberger Akademie der Wissenschaften e.V.
- 439 Tabula Mortuorum 2022
- 440 II. Gesamthaushalt 2022 der Heidelberger Akademie der Wissenschaften
- 441-446 III. Publikationen
-
435-439
I. Organe, Mitglieder, Institutionen
- 447-455 Personenregister
II. Wissenschaftliche Vorträge
Thomas Brox
„Wie Deep Learning die Bildbearbeitung verändert hat"
Sitzung der Mathematisch-naturwissenschaftlichen Klasse am
21. Januar 2022
Jedes Bild erzählt eine kleine Geschichte. Wenn wir ein Bild sehen, können wir
viel über das sagen, was in einer Szene passiert. Computer Vision hat zum Ziel
diese Fähigkeit, die Umgebung wahrzunchmen, auf den Computer zu übertragen.
Für uns Menschen erscheint diese Aufgabe trivial. Sobald ich Ihnen das Bild aber
nur als Zahlenkolonne zeige, und all die Verarbeitungsleistung, die unser Gehirn
normalerweise zur Bildverarbeitung nutzt, nicht mehr zur Verfügung steht, sind
wir mit der Aufgabe völlig überfordert.
Schon in den 20er Jahren haben sich Psychologen mit der Frage beschäftigt,
wie die menschliche Wahrnehmung mit dem visuellen Stimulus zusammenhängt.
So leitet Wertheimer eine seiner berühmtesten Abhandlungen ein mit: „Ich stehe
am Fenster und sehe ein Haus, Bäume, Himmel. Und könnte nun, aus theore-
tischen Gründen, abzuzählen versuchen und sagen: da sind . . . 327 Helligkeiten
(und Farbtöne). Habe ich „327“? Nein; [ich habe] Himmel, Haus, Bäume.“ Es
geht also vor allem darum, Rohdaten in semantisch sinnvolle Einheiten zu über-
führen, also Muster in den Daten zu erkennen.
Dabei besteht Verwechslungsgefahr. Die Lautsprecherbox aus dem vorigen
Bild ähnelt sehr dem Muster, das wir vom Hinterkopf eines Radfahrers erhalten.
Kleine Unterschiede in den Mustern können also sehr große Auswirkungen für
deren Bedeutung haben. Die Sache wird kompliziert, weil gleichzeitig die Variati-
on derselben Sache sehr groß sein kann. Die Muster von Hundebildern sehen teils
sehr unterschiedlich aus. Wir müssen also eine Repräsentation lernen, in denen all
diese Hundebilder ähnlich sind und sich trotzdem Lautsprecherboxen von Hin-
terköpfen unterscheiden lassen. (Abb. 1)
Das war bis vor nicht allzu langer Zeit noch sehr problematisch. Noch 2010
haben sich zahlreiche Wissenschaftler damit befasst, wie sie bessere Merkmale de-
finieren können. Eine damals beliebte und erfolgreiche Methode war es, lokale
Bildbereiche in Histogramme von Orientierungen der Bildkanten zu überführen
und diese Histogramme dann geeignet zusammengesetzt und normalisiert dem
Klassifikator zu übergeben. Sie können sich vorstellen, dass diese Beschreibung
nicht nur wenig präzise war, sondern auch viele Variationen in den Daten nicht
hinreichend widerspiegeln konnte.
38
Thomas Brox
„Wie Deep Learning die Bildbearbeitung verändert hat"
Sitzung der Mathematisch-naturwissenschaftlichen Klasse am
21. Januar 2022
Jedes Bild erzählt eine kleine Geschichte. Wenn wir ein Bild sehen, können wir
viel über das sagen, was in einer Szene passiert. Computer Vision hat zum Ziel
diese Fähigkeit, die Umgebung wahrzunchmen, auf den Computer zu übertragen.
Für uns Menschen erscheint diese Aufgabe trivial. Sobald ich Ihnen das Bild aber
nur als Zahlenkolonne zeige, und all die Verarbeitungsleistung, die unser Gehirn
normalerweise zur Bildverarbeitung nutzt, nicht mehr zur Verfügung steht, sind
wir mit der Aufgabe völlig überfordert.
Schon in den 20er Jahren haben sich Psychologen mit der Frage beschäftigt,
wie die menschliche Wahrnehmung mit dem visuellen Stimulus zusammenhängt.
So leitet Wertheimer eine seiner berühmtesten Abhandlungen ein mit: „Ich stehe
am Fenster und sehe ein Haus, Bäume, Himmel. Und könnte nun, aus theore-
tischen Gründen, abzuzählen versuchen und sagen: da sind . . . 327 Helligkeiten
(und Farbtöne). Habe ich „327“? Nein; [ich habe] Himmel, Haus, Bäume.“ Es
geht also vor allem darum, Rohdaten in semantisch sinnvolle Einheiten zu über-
führen, also Muster in den Daten zu erkennen.
Dabei besteht Verwechslungsgefahr. Die Lautsprecherbox aus dem vorigen
Bild ähnelt sehr dem Muster, das wir vom Hinterkopf eines Radfahrers erhalten.
Kleine Unterschiede in den Mustern können also sehr große Auswirkungen für
deren Bedeutung haben. Die Sache wird kompliziert, weil gleichzeitig die Variati-
on derselben Sache sehr groß sein kann. Die Muster von Hundebildern sehen teils
sehr unterschiedlich aus. Wir müssen also eine Repräsentation lernen, in denen all
diese Hundebilder ähnlich sind und sich trotzdem Lautsprecherboxen von Hin-
terköpfen unterscheiden lassen. (Abb. 1)
Das war bis vor nicht allzu langer Zeit noch sehr problematisch. Noch 2010
haben sich zahlreiche Wissenschaftler damit befasst, wie sie bessere Merkmale de-
finieren können. Eine damals beliebte und erfolgreiche Methode war es, lokale
Bildbereiche in Histogramme von Orientierungen der Bildkanten zu überführen
und diese Histogramme dann geeignet zusammengesetzt und normalisiert dem
Klassifikator zu übergeben. Sie können sich vorstellen, dass diese Beschreibung
nicht nur wenig präzise war, sondern auch viele Variationen in den Daten nicht
hinreichend widerspiegeln konnte.
38