Metadaten

Heidelberger Akademie der Wissenschaften [Hrsg.]
Jahrbuch ... / Heidelberger Akademie der Wissenschaften: Jahrbuch 2018 — 2019

DOI Kapitel:
D. Förderung des wissenschaftlichen Nachwuchses
DOI Kapitel:
II. Das WIN-Kolleg
DOI Kapitel:
Sechster Forschungsschwerpunkt „Messen und Verstehen der Welt durch die Wissenschaft“
DOI Kapitel:
8. CAL²Lab – Erkundung der Rechtssprache in einer computer-gestützten Forschungsumgebung
DOI Seite / Zitierlink: 
https://doi.org/10.11588/diglit.55650#0361
Lizenz: Freier Zugang - alle Rechte vorbehalten

DWork-Logo
Überblick
Faksimile
0.5
1 cm
facsimile
Vollansicht
OCR-Volltext
D. Förderung des wissenschaftlichen Nachwuchses

Wortartenzugehörigkeit gespeichert, wodurch zumindest eine grobe Disambiguie-
rung nach SubstantivWerb/Adjektiv vorgenommen wurde. Da die Zuordnung der
Wortarten nicht rein computertechnisch lösbar ist, wurden alle Zweifelsfälle ma-
nuell geprüft. Für die gewonnenen Kombinationen aus Lemmata und Wortarten
(= Listenlemmata) wurden sogenannte Kontextprofile errechnet, d. h. es wurden
statistische Daten in Relation zu Vorkommen pro Jahr, Textsorte, Quartil, Gericht,
Zeitschrift und Autor erhoben. Zusätzlich wurden Mehrworteinheiten mit bis zu
5 Wortformen und diejenigen Begleitwörter berechnet (Nachbarn mit einer Um-
gebung von +/—8), mit denen sich die Zielwörter am signifikant häufigsten um-
geben, berechnet - auch wieder in Relation zu den vorher genannten Metadaten.
Die Berechnung der Daten erfolgte durch Java-Programme, die unter anderem die
Rechcnleistung eines Computerclusters (High Performance Computing) nutzten.
Die Ergebnisse wurden zur schnelleren Abfrage in einer relationalen Datenbank
mit 104 Tabellen gespeichert.
Die daraus gewonnenen Daten sind über eine Onlineplattform (frei verfügbar
ab vssl. Mitte 2019) durchsuchbar, wobei nicht nur mit dem Lemma, sondern auch
mit einer konkreten Wortform gesucht werden kann. Zudem kann die Suche über
die Metadaten eingeschränkt werden (Abb. 1). Damit ist beispielsweise eine Suche
nach dem Vorkommen eines Wortes während einer bestimmten Zeitperiode in
einer bestimmten Textsorte möglich.
Die statistischen Daten (Kontextprofile) werden dargestellt als ausklappbare
Listen (Abb. 2), sortiert nach der relativen Häufigkeit im (Sub-) Korpus. Daneben
werden bis zu 1.000 Textauszüge pro Suchwort in Form einer Key-Word-In-Con-
text-Darstellung angezeigt, um dem Benutzer konkrete Verwendungsbeispiele der
Listenlemmata an

CA.I2LAB

Interdisziplinäre Forschungs- und Experimentierplattform
zur empirischen Analyse juristischer Begriffssystematik

|Listenlemma | |sudien| Suche über Token Hilfe • Module

Eingabe: "rechtsbegriff"

Falls Sie die Suche einschränken, wird das Ergebnis mit einer Auswahl von maximal
1000 Vorkommen (Zufallsstichprobe) berechnet.

Ergebnisse eingrenzen:

Texttyp | Entscheidungen |
Quartil | v|
Jahr von |19bo ~

] bis |zooo| ]

Gericht |
Autor |
Zeitschrift |

©Rechtsbegriff (Substantiv)
O rechtsbegrifflichen (Adjektiv)

Eingaben prüfen

Startseite ■ Korpus ■ Module ■ Impressum ■ Hilfe

Abb. 1: Suchmaske CAL'Lab

die Hand zu geben
(Abb. 3).
Während diese
Arbeiten liefen, wur-
de Kollegiat Friede-
mann Vogel auf einen
Lehrstuhl (W3) an
der Universität Sie-
gen berufen, wo er
seit dem Frühjahr
2018 die Sozio- und
Diskurslinguistik in
Lehre und Forschung
vertritt, mit beson-
derem Schwerpunkt
auf Rechtslinguistik

362
 
Annotationen
© Heidelberger Akademie der Wissenschaften