8. CAL2Lab (WIN-Programm)
8. CAL2Lab - Erkundung der Rechtssprache in einer
computergestützten Forschungsumgebung
Kollegiaten: Prof. Dr. Friedemann Vogel1, Dr. Dr. Hanjo Hamann2
Mitarbeiterinnen: Isabelle Gauer3, Yinchun Bai3
1 Lehrstuhl für Germanistik: Sozio- und Diskurslinguistik, Universität Siegen
2 Max-Planck-Institut zur Erforschung von Gemeinschaftsgütern, Bonn, und Fellow des Jun-
gen ZiF (Zentrum für interdisziplinäre Forschung), Bielefeld
3 Institut für Medienkulturwissenschaft, Albert-Ludwigs-Universität Freiburg
Hintergrund
Das Kollegprojekt „Juristisches Referenzkorpus (JuReko)“ vereint neuere Er-
kenntnisinteressen und Methoden zweier Disziplinen - der Rechts- und Sprach-
wissenschaft um Wege zur Entwicklung einer Computer- und korpusgestützten
Rechtslinguistik zu finden und die interdisziplinären Möglichkeiten und Grenzen
einer „Ausmessung“ juristischer Diskurse auszuloten. Die Begegnung einer evi-
denzbasierten Jurisprudenz mit der empirischen Computerlinguistik spürt „Dis-
kurssedimenten“ in großen Textmengen nach und soll dadurch die Entstehung
und Entwicklung dogmatischer Lehren, wissenschaftlicher Schulen und sozialer
Netzwerke untersuchen helfen. Damit schlägt das Projekt Brücken zwischen
neuerer empirischer Rechtsforschung auf der einen und computergestützter und
rechtsmethodisch geschulter Korpuslinguistik auf der anderen Seite. Dieser Brü-
ckenschlag erfolgt zugleich zwischen den Kulturen, indem besonderer Wert auf
die Vernetzung mit international führenden Forschern zum Thema „Sprache und
Recht“ gelegt wird.
Projektstand
Im vierten Jahr des Kollegprojekts wurde das in den Vorjahresberichten erläuterte
Referenzkorpus um eine Benutzeroberfläche erweitert, die mittelfristig als öffent-
liche Forschungsinfrastruktur für interessierte Rechtslinguist(inn)en zur Verfü-
gung stehen soll. Dazu wird derzeit eine Online-Plattform entwickelt, die einen
selektiven und geschützten Zugriff auf das Referenzkorpus verknüpft mit dem
Angebot umfassender Metriken zur juristischen Sprache und Begriffsbildung. Im
Fokus steht die kontextuelle Bestimmtheit bzw. Unbestimmtheit juristischer Aus-
drücke sowohl diachron (Begriffswandel über die Zeit) als auch synchron (Quer-
schnitt durch juristische Schulen, Medien, Textsorten, Rechtsbereiche u. a.).
Konkret wurden die im Korpus nach Dcduplikation enthaltenen knapp
1 Mrd. Wortformen computerlinguistisch so aufbereitet, dass 200.000 bedeutungs-
tragende Hauptwörter (Substantiv-, Verb- und Adjektivlemmata, ohne Namen
und Abkürzungen) ausgewählt wurden. Diese wurden in Verbindung mit ihrer
361
8. CAL2Lab - Erkundung der Rechtssprache in einer
computergestützten Forschungsumgebung
Kollegiaten: Prof. Dr. Friedemann Vogel1, Dr. Dr. Hanjo Hamann2
Mitarbeiterinnen: Isabelle Gauer3, Yinchun Bai3
1 Lehrstuhl für Germanistik: Sozio- und Diskurslinguistik, Universität Siegen
2 Max-Planck-Institut zur Erforschung von Gemeinschaftsgütern, Bonn, und Fellow des Jun-
gen ZiF (Zentrum für interdisziplinäre Forschung), Bielefeld
3 Institut für Medienkulturwissenschaft, Albert-Ludwigs-Universität Freiburg
Hintergrund
Das Kollegprojekt „Juristisches Referenzkorpus (JuReko)“ vereint neuere Er-
kenntnisinteressen und Methoden zweier Disziplinen - der Rechts- und Sprach-
wissenschaft um Wege zur Entwicklung einer Computer- und korpusgestützten
Rechtslinguistik zu finden und die interdisziplinären Möglichkeiten und Grenzen
einer „Ausmessung“ juristischer Diskurse auszuloten. Die Begegnung einer evi-
denzbasierten Jurisprudenz mit der empirischen Computerlinguistik spürt „Dis-
kurssedimenten“ in großen Textmengen nach und soll dadurch die Entstehung
und Entwicklung dogmatischer Lehren, wissenschaftlicher Schulen und sozialer
Netzwerke untersuchen helfen. Damit schlägt das Projekt Brücken zwischen
neuerer empirischer Rechtsforschung auf der einen und computergestützter und
rechtsmethodisch geschulter Korpuslinguistik auf der anderen Seite. Dieser Brü-
ckenschlag erfolgt zugleich zwischen den Kulturen, indem besonderer Wert auf
die Vernetzung mit international führenden Forschern zum Thema „Sprache und
Recht“ gelegt wird.
Projektstand
Im vierten Jahr des Kollegprojekts wurde das in den Vorjahresberichten erläuterte
Referenzkorpus um eine Benutzeroberfläche erweitert, die mittelfristig als öffent-
liche Forschungsinfrastruktur für interessierte Rechtslinguist(inn)en zur Verfü-
gung stehen soll. Dazu wird derzeit eine Online-Plattform entwickelt, die einen
selektiven und geschützten Zugriff auf das Referenzkorpus verknüpft mit dem
Angebot umfassender Metriken zur juristischen Sprache und Begriffsbildung. Im
Fokus steht die kontextuelle Bestimmtheit bzw. Unbestimmtheit juristischer Aus-
drücke sowohl diachron (Begriffswandel über die Zeit) als auch synchron (Quer-
schnitt durch juristische Schulen, Medien, Textsorten, Rechtsbereiche u. a.).
Konkret wurden die im Korpus nach Dcduplikation enthaltenen knapp
1 Mrd. Wortformen computerlinguistisch so aufbereitet, dass 200.000 bedeutungs-
tragende Hauptwörter (Substantiv-, Verb- und Adjektivlemmata, ohne Namen
und Abkürzungen) ausgewählt wurden. Diese wurden in Verbindung mit ihrer
361