D. Förderung des wissenschaftlichen Nachwuchses
Wortartenzugehörigkeit gespeichert, wodurch zumindest eine grobe Disambiguie-
rung nach SubstantivWerb/Adjektiv vorgenommen wurde. Da die Zuordnung der
Wortarten nicht rein computertechnisch lösbar ist, wurden alle Zweifelsfälle ma-
nuell geprüft. Für die gewonnenen Kombinationen aus Lemmata und Wortarten
(= Listenlemmata) wurden sogenannte Kontextprofile errechnet, d. h. es wurden
statistische Daten in Relation zu Vorkommen pro Jahr, Textsorte, Quartil, Gericht,
Zeitschrift und Autor erhoben. Zusätzlich wurden Mehrworteinheiten mit bis zu
5 Wortformen und diejenigen Begleitwörter berechnet (Nachbarn mit einer Um-
gebung von +/—8), mit denen sich die Zielwörter am signifikant häufigsten um-
geben, berechnet - auch wieder in Relation zu den vorher genannten Metadaten.
Die Berechnung der Daten erfolgte durch Java-Programme, die unter anderem die
Rechcnleistung eines Computerclusters (High Performance Computing) nutzten.
Die Ergebnisse wurden zur schnelleren Abfrage in einer relationalen Datenbank
mit 104 Tabellen gespeichert.
Die daraus gewonnenen Daten sind über eine Onlineplattform (frei verfügbar
ab vssl. Mitte 2019) durchsuchbar, wobei nicht nur mit dem Lemma, sondern auch
mit einer konkreten Wortform gesucht werden kann. Zudem kann die Suche über
die Metadaten eingeschränkt werden (Abb. 1). Damit ist beispielsweise eine Suche
nach dem Vorkommen eines Wortes während einer bestimmten Zeitperiode in
einer bestimmten Textsorte möglich.
Die statistischen Daten (Kontextprofile) werden dargestellt als ausklappbare
Listen (Abb. 2), sortiert nach der relativen Häufigkeit im (Sub-) Korpus. Daneben
werden bis zu 1.000 Textauszüge pro Suchwort in Form einer Key-Word-In-Con-
text-Darstellung angezeigt, um dem Benutzer konkrete Verwendungsbeispiele der
Listenlemmata an
CA.I2LAB
Interdisziplinäre Forschungs- und Experimentierplattform
zur empirischen Analyse juristischer Begriffssystematik
|Listenlemma | |sudien| Suche über Token Hilfe • Module
Eingabe: "rechtsbegriff"
Falls Sie die Suche einschränken, wird das Ergebnis mit einer Auswahl von maximal
1000 Vorkommen (Zufallsstichprobe) berechnet.
Ergebnisse eingrenzen:
Texttyp | Entscheidungen |
Quartil | v|
Jahr von |19bo ~
] bis |zooo| ]
Gericht |
Autor |
Zeitschrift |
©Rechtsbegriff (Substantiv)
O rechtsbegrifflichen (Adjektiv)
Eingaben prüfen
Startseite ■ Korpus ■ Module ■ Impressum ■ Hilfe
Abb. 1: Suchmaske CAL'Lab
die Hand zu geben
(Abb. 3).
Während diese
Arbeiten liefen, wur-
de Kollegiat Friede-
mann Vogel auf einen
Lehrstuhl (W3) an
der Universität Sie-
gen berufen, wo er
seit dem Frühjahr
2018 die Sozio- und
Diskurslinguistik in
Lehre und Forschung
vertritt, mit beson-
derem Schwerpunkt
auf Rechtslinguistik
362
Wortartenzugehörigkeit gespeichert, wodurch zumindest eine grobe Disambiguie-
rung nach SubstantivWerb/Adjektiv vorgenommen wurde. Da die Zuordnung der
Wortarten nicht rein computertechnisch lösbar ist, wurden alle Zweifelsfälle ma-
nuell geprüft. Für die gewonnenen Kombinationen aus Lemmata und Wortarten
(= Listenlemmata) wurden sogenannte Kontextprofile errechnet, d. h. es wurden
statistische Daten in Relation zu Vorkommen pro Jahr, Textsorte, Quartil, Gericht,
Zeitschrift und Autor erhoben. Zusätzlich wurden Mehrworteinheiten mit bis zu
5 Wortformen und diejenigen Begleitwörter berechnet (Nachbarn mit einer Um-
gebung von +/—8), mit denen sich die Zielwörter am signifikant häufigsten um-
geben, berechnet - auch wieder in Relation zu den vorher genannten Metadaten.
Die Berechnung der Daten erfolgte durch Java-Programme, die unter anderem die
Rechcnleistung eines Computerclusters (High Performance Computing) nutzten.
Die Ergebnisse wurden zur schnelleren Abfrage in einer relationalen Datenbank
mit 104 Tabellen gespeichert.
Die daraus gewonnenen Daten sind über eine Onlineplattform (frei verfügbar
ab vssl. Mitte 2019) durchsuchbar, wobei nicht nur mit dem Lemma, sondern auch
mit einer konkreten Wortform gesucht werden kann. Zudem kann die Suche über
die Metadaten eingeschränkt werden (Abb. 1). Damit ist beispielsweise eine Suche
nach dem Vorkommen eines Wortes während einer bestimmten Zeitperiode in
einer bestimmten Textsorte möglich.
Die statistischen Daten (Kontextprofile) werden dargestellt als ausklappbare
Listen (Abb. 2), sortiert nach der relativen Häufigkeit im (Sub-) Korpus. Daneben
werden bis zu 1.000 Textauszüge pro Suchwort in Form einer Key-Word-In-Con-
text-Darstellung angezeigt, um dem Benutzer konkrete Verwendungsbeispiele der
Listenlemmata an
CA.I2LAB
Interdisziplinäre Forschungs- und Experimentierplattform
zur empirischen Analyse juristischer Begriffssystematik
|Listenlemma | |sudien| Suche über Token Hilfe • Module
Eingabe: "rechtsbegriff"
Falls Sie die Suche einschränken, wird das Ergebnis mit einer Auswahl von maximal
1000 Vorkommen (Zufallsstichprobe) berechnet.
Ergebnisse eingrenzen:
Texttyp | Entscheidungen |
Quartil | v|
Jahr von |19bo ~
] bis |zooo| ]
Gericht |
Autor |
Zeitschrift |
©Rechtsbegriff (Substantiv)
O rechtsbegrifflichen (Adjektiv)
Eingaben prüfen
Startseite ■ Korpus ■ Module ■ Impressum ■ Hilfe
Abb. 1: Suchmaske CAL'Lab
die Hand zu geben
(Abb. 3).
Während diese
Arbeiten liefen, wur-
de Kollegiat Friede-
mann Vogel auf einen
Lehrstuhl (W3) an
der Universität Sie-
gen berufen, wo er
seit dem Frühjahr
2018 die Sozio- und
Diskurslinguistik in
Lehre und Forschung
vertritt, mit beson-
derem Schwerpunkt
auf Rechtslinguistik
362