Metadaten

Heidelberger Akademie der Wissenschaften [Editor]
Jahrbuch ... / Heidelberger Akademie der Wissenschaften: Jahrbuch 2018 — 2019

DOI chapter:
D. Förderung des wissenschaftlichen Nachwuchses
DOI chapter:
II. Das WIN-Kolleg
DOI chapter:
Sechster Forschungsschwerpunkt „Messen und Verstehen der Welt durch die Wissenschaft“
DOI chapter:
8. CAL²Lab – Erkundung der Rechtssprache in einer computer-gestützten Forschungsumgebung
DOI Page / Citation link: 
https://doi.org/10.11588/diglit.55650#0361
License: Free access  - all rights reserved

DWork-Logo
Overview
Facsimile
0.5
1 cm
facsimile
Scroll
OCR fulltext
D. Förderung des wissenschaftlichen Nachwuchses

Wortartenzugehörigkeit gespeichert, wodurch zumindest eine grobe Disambiguie-
rung nach SubstantivWerb/Adjektiv vorgenommen wurde. Da die Zuordnung der
Wortarten nicht rein computertechnisch lösbar ist, wurden alle Zweifelsfälle ma-
nuell geprüft. Für die gewonnenen Kombinationen aus Lemmata und Wortarten
(= Listenlemmata) wurden sogenannte Kontextprofile errechnet, d. h. es wurden
statistische Daten in Relation zu Vorkommen pro Jahr, Textsorte, Quartil, Gericht,
Zeitschrift und Autor erhoben. Zusätzlich wurden Mehrworteinheiten mit bis zu
5 Wortformen und diejenigen Begleitwörter berechnet (Nachbarn mit einer Um-
gebung von +/—8), mit denen sich die Zielwörter am signifikant häufigsten um-
geben, berechnet - auch wieder in Relation zu den vorher genannten Metadaten.
Die Berechnung der Daten erfolgte durch Java-Programme, die unter anderem die
Rechcnleistung eines Computerclusters (High Performance Computing) nutzten.
Die Ergebnisse wurden zur schnelleren Abfrage in einer relationalen Datenbank
mit 104 Tabellen gespeichert.
Die daraus gewonnenen Daten sind über eine Onlineplattform (frei verfügbar
ab vssl. Mitte 2019) durchsuchbar, wobei nicht nur mit dem Lemma, sondern auch
mit einer konkreten Wortform gesucht werden kann. Zudem kann die Suche über
die Metadaten eingeschränkt werden (Abb. 1). Damit ist beispielsweise eine Suche
nach dem Vorkommen eines Wortes während einer bestimmten Zeitperiode in
einer bestimmten Textsorte möglich.
Die statistischen Daten (Kontextprofile) werden dargestellt als ausklappbare
Listen (Abb. 2), sortiert nach der relativen Häufigkeit im (Sub-) Korpus. Daneben
werden bis zu 1.000 Textauszüge pro Suchwort in Form einer Key-Word-In-Con-
text-Darstellung angezeigt, um dem Benutzer konkrete Verwendungsbeispiele der
Listenlemmata an

CA.I2LAB

Interdisziplinäre Forschungs- und Experimentierplattform
zur empirischen Analyse juristischer Begriffssystematik

|Listenlemma | |sudien| Suche über Token Hilfe • Module

Eingabe: "rechtsbegriff"

Falls Sie die Suche einschränken, wird das Ergebnis mit einer Auswahl von maximal
1000 Vorkommen (Zufallsstichprobe) berechnet.

Ergebnisse eingrenzen:

Texttyp | Entscheidungen |
Quartil | v|
Jahr von |19bo ~

] bis |zooo| ]

Gericht |
Autor |
Zeitschrift |

©Rechtsbegriff (Substantiv)
O rechtsbegrifflichen (Adjektiv)

Eingaben prüfen

Startseite ■ Korpus ■ Module ■ Impressum ■ Hilfe

Abb. 1: Suchmaske CAL'Lab

die Hand zu geben
(Abb. 3).
Während diese
Arbeiten liefen, wur-
de Kollegiat Friede-
mann Vogel auf einen
Lehrstuhl (W3) an
der Universität Sie-
gen berufen, wo er
seit dem Frühjahr
2018 die Sozio- und
Diskurslinguistik in
Lehre und Forschung
vertritt, mit beson-
derem Schwerpunkt
auf Rechtslinguistik

362
 
Annotationen
© Heidelberger Akademie der Wissenschaften