Metadaten

Heidelberger Akademie der Wissenschaften [Hrsg.]
Jahrbuch ... / Heidelberger Akademie der Wissenschaften: Jahrbuch 2022 — 2023

DOI Kapitel:
D. Förderung des wissenschaftlichen Nachwuchses
DOI Kapitel:
III. Das WIN-Kolleg der Jungen Akademie | HAdW
DOI Kapitel:
Siebter Forschungsschwerpunkt: „Wie entscheiden Kollektive?“
DOI Seite / Zitierlink: 
https://doi.org/10.11588/diglit.67410#0392
Lizenz: Freier Zugang - alle Rechte vorbehalten

DWork-Logo
Überblick
Faksimile
0.5
1 cm
facsimile
Vollansicht
OCR-Volltext
D. Förderung des wissenschaftlichen Nachwuchses

Im ersten Teilprojekt wird nun an der Verbesserung der automatischen Iden-
tifikation von verzerrter Berichterstattung geforscht. Die Erforschung von Me-
thoden im Bereich Natural Language Processing (NLP) liegt dabei im Fokus des
ersten Projektjahrs. Abbildung 1 zeigt die einzelnen Schritte unserer Methode, um
Nachrichtenartikel mit ähnlichem Framing zu identifizieren und zu gruppieren.
Der Vergleich dieser Gruppen (Frame Clusters) offenbart schließlich den zugrun-
deliegenden Media Bias. Ein Nachteil dieser und vieler aktueller Methoden ist
jedoch, dass häufig große Mengen an Trainingsdaten benötigt werden. Dies ist ins-
besondere der Fall bei schwierigen Klassifikationsaufgaben wie der Identifikation
von Bias. Ein Grund hierfür ist, dass sich Bias oftmals subtil oder implizit mani-
festiert und somit potenziell einen größeren Interpretationsspielraum als bei Klas-
sifikationsaufgaben mit expliziteren Merkmalen zulässt. Ein geläufiges Beispiel für
einen expliziteren Kontext sind Sentimentklassifikationen in Social Media Posts
oder Produktrezensionen, da dort Autorinnen und Autoren ihre Meinung explizit
kundtun. Daher forscht das Informatikteam, dem auch Tilman Hornung sowie
einige wissenschaftliche Hilfskräfte angehören, an Methoden, die bereits mit we-
nigen Trainingsdaten eine hohe Genauigkeit erzielen können. Wir erwarten, dass
wir die Arbeiten hieran in der ersten Jahreshälfte 2023 abschließen können. Dem
Informatikunterprojekt arbeiteten außerdem Moritz Bock und Franziska Weeber
zu. Moritz Bock kümmerte sich vor allem um die Wartung und Verbesserung der
aus dem vorherigen Projektzeitraum bestehenden Softwarearchitektur. Franziska
Weeber untersuchte Methoden zur Klassifizierung langer Textdokumente, um so-
mit besser Nachrichtenartikel klassifizieren zu können, die standardmäßig in der
Regel zu lang für etablierte Sprachmodelle sind. Außerdem betreute sie mehrere
Studierendenprojekte im Umfeld des sogenannten Active Learning zur Klassifikati-
on von Nachrichtenartikeln. Ein Nebenzicl für das Jahr 2023 ist die Bereitstellung
eines im Web frei verfügbaren Nachrichtenaggregators, der Nachrichtenkonsu-
mierenden mithilfe unseres Systems verschiedene Perspektiven in der Berichter-
stattung auf intuitive Art anzeigt.

News articles
Preprocessing
*■
Target Concept Analysis
->
Frame Analysis
Sentence Splitting
Candidate Extraction
Target-dependent
Sentiment Classification
Tokenization
Co-
references
NPs
VPs
Deep Learning Classifier
POStagging
Parsing
Candidate Merging
Frame Clustering
Dependency parsing
NE recognition
Rule-based System
Coref.-resolution


Abb. 1: Abfolge der einzelnen NLP-Schritte in der automatischen Identifikation von Media Bias. Die einzelnen
Schritte werden von links nach rechts und von oben nach unten ausgeführt.

392
 
Annotationen
© Heidelberger Akademie der Wissenschaften