10. Computergestützte Rechtslinguistik (WIN-Programm)
10. Computergestützte Rechtslinguistik (CAL2) - Das Gewirk von
Sprache und Dogmatik des Rechts am Beispiel des JuReko-
Referenzkorpus *
Kollegiaten: Jun.-Prof. Dr. Friedemann Vogel1, Dr. Dr. Hanjo Hamann2
Mitarbeiter: Isabelle Gauer1, Yinchun Bai1, Julia Kanthak1
1 Institut für Medienkulturwissenschaft, Universität Freiburg
2 Max-Planck-Institut zur Erforschung von Gemeinschaftsgütern, Bonn; Fellow des Jungen
ZiF (Zentrum für interdisziplinäre Forschung), Bielefeld
Hintergrund
Das Kollegprojekt „Juristisches Referenzkorpus (JuRcko)“ widmet sich interdiszi-
plinär den Möglichkeiten und Grenzen einer „Ausmessung“ juristischer Diskurse.
Dabei werden neuere Erkenntnisinteressen und Methoden zweier Disziplinen —
der Rechts- und Sprachwissenschaft - vereint und Wege zur Entwicklung einer
Computer- und korpusgestützten Rechtslinguistik beschritten. Die Begegnung
einer evidenzbasierten Jurisprudenz mit der empirischen Computerlinguistik er-
möglicht es, in großen Textmengen Diskurssedimente aufzuspüren und dadurch
die Entstehung und Entwicklung dogmatischer Lehren, wissenschaftlicher Schu-
len und sozialer Netzwerke zu untersuchen. Damit schlägt das Projekt Brücken
zwischen neuerer empirischer Rechtsforschung auf der einen und computerge-
stützter und rechtsmethodisch geschulter Korpuslinguistik auf der anderen Seite.
Dieser Brückenschlag erfolgt zugleich zwischen den Kulturen, indem besonderer
Wert auf die Vernetzung mit international führenden und am Thema „Sprache
und Recht“ interessierten Fachkollegen gelegt wird.
Projektstand
Die ersten beiden Phasen des Projekts sind abgeschlossen: Die im Rahmen der
Korpuskonzeption ausgewählten Texte (6.300 Gesetzestexte, 370.000 Gerichtsent-
scheidungen, 43.000 wissenschaftliche Aufsätze) wurden in der anfangs entwickel-
ten Datenbankstruktur erfasst und ihre Metadaten unter großem Arbeitsaufwand
manuell nachkorrigiert, um eine hochvalide Datengrundlage zu erhalten. Die Voll-
texte der erfassten Dokumente wurden mittels der Software jTidy in ein TEI-P5-
konformes xml-Format konvertiert, xsl-transformiert und mit Hilfe des TreeTag-
gers (Schmid 1994) annotiert, also computergestützt mit Zusatzinformationen zu
Wortarten, Lemmata und Textstruktur angereichert.
Früherer Titel des Projekts: „Vom corpus iuris zu den corpora iurum. Konzeption und Er-
schließung eines juristischen Referenzkorpus (JuReko)“
251
10. Computergestützte Rechtslinguistik (CAL2) - Das Gewirk von
Sprache und Dogmatik des Rechts am Beispiel des JuReko-
Referenzkorpus *
Kollegiaten: Jun.-Prof. Dr. Friedemann Vogel1, Dr. Dr. Hanjo Hamann2
Mitarbeiter: Isabelle Gauer1, Yinchun Bai1, Julia Kanthak1
1 Institut für Medienkulturwissenschaft, Universität Freiburg
2 Max-Planck-Institut zur Erforschung von Gemeinschaftsgütern, Bonn; Fellow des Jungen
ZiF (Zentrum für interdisziplinäre Forschung), Bielefeld
Hintergrund
Das Kollegprojekt „Juristisches Referenzkorpus (JuRcko)“ widmet sich interdiszi-
plinär den Möglichkeiten und Grenzen einer „Ausmessung“ juristischer Diskurse.
Dabei werden neuere Erkenntnisinteressen und Methoden zweier Disziplinen —
der Rechts- und Sprachwissenschaft - vereint und Wege zur Entwicklung einer
Computer- und korpusgestützten Rechtslinguistik beschritten. Die Begegnung
einer evidenzbasierten Jurisprudenz mit der empirischen Computerlinguistik er-
möglicht es, in großen Textmengen Diskurssedimente aufzuspüren und dadurch
die Entstehung und Entwicklung dogmatischer Lehren, wissenschaftlicher Schu-
len und sozialer Netzwerke zu untersuchen. Damit schlägt das Projekt Brücken
zwischen neuerer empirischer Rechtsforschung auf der einen und computerge-
stützter und rechtsmethodisch geschulter Korpuslinguistik auf der anderen Seite.
Dieser Brückenschlag erfolgt zugleich zwischen den Kulturen, indem besonderer
Wert auf die Vernetzung mit international führenden und am Thema „Sprache
und Recht“ interessierten Fachkollegen gelegt wird.
Projektstand
Die ersten beiden Phasen des Projekts sind abgeschlossen: Die im Rahmen der
Korpuskonzeption ausgewählten Texte (6.300 Gesetzestexte, 370.000 Gerichtsent-
scheidungen, 43.000 wissenschaftliche Aufsätze) wurden in der anfangs entwickel-
ten Datenbankstruktur erfasst und ihre Metadaten unter großem Arbeitsaufwand
manuell nachkorrigiert, um eine hochvalide Datengrundlage zu erhalten. Die Voll-
texte der erfassten Dokumente wurden mittels der Software jTidy in ein TEI-P5-
konformes xml-Format konvertiert, xsl-transformiert und mit Hilfe des TreeTag-
gers (Schmid 1994) annotiert, also computergestützt mit Zusatzinformationen zu
Wortarten, Lemmata und Textstruktur angereichert.
Früherer Titel des Projekts: „Vom corpus iuris zu den corpora iurum. Konzeption und Er-
schließung eines juristischen Referenzkorpus (JuReko)“
251