C. Förderung des wissenschaftlichen Nachwuchses
Diese computerlinguistischen Arbeiten wurden Ende 2015 abgeschlossen und
im März 2016 auf der dritten Jahrestagung des Verbands „Digital Humanities im
deutschsprachigen Raum e. V“ in Leipzig der Forschungsöffentlichkeit vorgestellt.
Das Kernkorpus zur empirischen Erforschung zeitgenössischer Rechtssprache,
-kommunikation und -methodik steht damit in folgendem Umfang bereit:
Textsorte
Quelle
Zeitraum
Zahl Texte
Zahl Tokens
Datenmenge
Gesetze
Bund, BMJV
2015
6.366
19.460.327
325 MB
Recht-
sprechung
BGH
1951-2015
40.176
58.181.286
940 MB
BVerfG
1951-2014
4.474
10.766.647
179 MB
AG/LG/OLG
1968-2015
85.229
225.340.131
3,883 GB
andere
1882-2015
238.737
728.742.573
12,612 GB
Fach-
aufsätze
NJW/ZRP
1981-2012
9.334
50.045.433
808 MB
MDR
1981-2015
2.688
11.949.257
189 MB
JA/JtiS
2000-2012
3.261
17.985.884
284 MB
DÖV/NVwZ
1982-2012
4.585
28.632.615
467 MB
ZStW/NStZ
1981-2013
2.371
15.580.589
249 MB
ZGR/ZIP
2000-2014
729
7.716.853
124 MB
AG/BB
1991-2014
10.126
58.734.088
961 MB
andere
1984-2015
9.452
59.986.403
970 MB
Gesamt
1951-2015
375.381
1.293.122.086
21,991 GB
Die daran anschließende dritte Phase des Projekts (analytische Erschließung)
läuft noch: Auf Basis semiautomatischer Verfahren wurden die erhobenen Texte
analytisch erschlossen und dabei die Möglichkeiten und Grenzen einer rechtslin-
guistisch fundierten, computergestützten Korpusempirie für Sprach- und Rechts-
wissenschaft ausgelotet. Zur mitlaufenden epistemologischen Reflexion dieses
Prozesses veranstaltete die Projektgruppe im März 2016 in Heidelberg eine in-
ternationale Tagung (dazu näher unten) und verfasste auf dieser Grundlage bis
August 2016 ein gemeinsames Arbeitspapier unter dem Arbeitstitel „Computer
Assisted Legal Linguistics: Corpus Analysis as a New Tool for Legal Studies“, das
als Programmschrift für die weitere analytische Erschließung dienen soll. Es wur-
de nach positiver Peer-Review im Januar 2017 von der interdisziplinären Fachzeit-
schrift Law & Social Inquiry (LSI) zur Veröffentlichung angenommen.
Allmählich tritt das Projekt damit in seine vorerst letzte Phase (Evaluation und
Dokumentation) ein: Die auf der Konferenz im März 2016 präsentierten Studien
wurden inzwischen verschriftlicht und werden derzeit zur externen Begutachtung
und Veröffentlichung im International Journal ofLanguage & Law (JLL) vorbereitet,
nachdem ein erstes Tagungsfazit bereits im Juli 2016 in der Open-Access-Zeit-
schrift The Winnower publiziert worden war. Desweiteren wurden die Projekter-
gebnisse im Dezember 2016 auf der internationalen Rechtsinformatik-Konferenz
252
Diese computerlinguistischen Arbeiten wurden Ende 2015 abgeschlossen und
im März 2016 auf der dritten Jahrestagung des Verbands „Digital Humanities im
deutschsprachigen Raum e. V“ in Leipzig der Forschungsöffentlichkeit vorgestellt.
Das Kernkorpus zur empirischen Erforschung zeitgenössischer Rechtssprache,
-kommunikation und -methodik steht damit in folgendem Umfang bereit:
Textsorte
Quelle
Zeitraum
Zahl Texte
Zahl Tokens
Datenmenge
Gesetze
Bund, BMJV
2015
6.366
19.460.327
325 MB
Recht-
sprechung
BGH
1951-2015
40.176
58.181.286
940 MB
BVerfG
1951-2014
4.474
10.766.647
179 MB
AG/LG/OLG
1968-2015
85.229
225.340.131
3,883 GB
andere
1882-2015
238.737
728.742.573
12,612 GB
Fach-
aufsätze
NJW/ZRP
1981-2012
9.334
50.045.433
808 MB
MDR
1981-2015
2.688
11.949.257
189 MB
JA/JtiS
2000-2012
3.261
17.985.884
284 MB
DÖV/NVwZ
1982-2012
4.585
28.632.615
467 MB
ZStW/NStZ
1981-2013
2.371
15.580.589
249 MB
ZGR/ZIP
2000-2014
729
7.716.853
124 MB
AG/BB
1991-2014
10.126
58.734.088
961 MB
andere
1984-2015
9.452
59.986.403
970 MB
Gesamt
1951-2015
375.381
1.293.122.086
21,991 GB
Die daran anschließende dritte Phase des Projekts (analytische Erschließung)
läuft noch: Auf Basis semiautomatischer Verfahren wurden die erhobenen Texte
analytisch erschlossen und dabei die Möglichkeiten und Grenzen einer rechtslin-
guistisch fundierten, computergestützten Korpusempirie für Sprach- und Rechts-
wissenschaft ausgelotet. Zur mitlaufenden epistemologischen Reflexion dieses
Prozesses veranstaltete die Projektgruppe im März 2016 in Heidelberg eine in-
ternationale Tagung (dazu näher unten) und verfasste auf dieser Grundlage bis
August 2016 ein gemeinsames Arbeitspapier unter dem Arbeitstitel „Computer
Assisted Legal Linguistics: Corpus Analysis as a New Tool for Legal Studies“, das
als Programmschrift für die weitere analytische Erschließung dienen soll. Es wur-
de nach positiver Peer-Review im Januar 2017 von der interdisziplinären Fachzeit-
schrift Law & Social Inquiry (LSI) zur Veröffentlichung angenommen.
Allmählich tritt das Projekt damit in seine vorerst letzte Phase (Evaluation und
Dokumentation) ein: Die auf der Konferenz im März 2016 präsentierten Studien
wurden inzwischen verschriftlicht und werden derzeit zur externen Begutachtung
und Veröffentlichung im International Journal ofLanguage & Law (JLL) vorbereitet,
nachdem ein erstes Tagungsfazit bereits im Juli 2016 in der Open-Access-Zeit-
schrift The Winnower publiziert worden war. Desweiteren wurden die Projekter-
gebnisse im Dezember 2016 auf der internationalen Rechtsinformatik-Konferenz
252