Benutzer: Gast  Login
Titel:

Legal GCD – Corpus of German Court Decisions

Verantwortlich:
Gebendorfer, Christoph; Elnaggar, Ahmed
Autorinnen / Autoren:
Gebendorfer, Christoph; Elnaggar, Ahmed
Institutionszugehörigkeit:
TUM
Herausgeber:
TUM
Identifikator:
doi:10.14459/2018md1446651
Enddatum der Datenerzeugung:
30.01.2018
Fachgebiet:
DAT Datenverarbeitung, Informatik
zusätzliche Fachgebiete:
Legal Domain
Quellen der Daten:
Textdokumente / text documents
Datentyp:
Texte / texts
Methode der Datenerhebung:
Scraped from the official website: https://www.rechtsprechung-im-internet.de/jportal/portal/page/bsjrsprod.psml
Beschreibung:
This corpus contains court decisions scraped from the official website for the publication of court decisions by the Bundesministerium der Justiz und für Verbraucherschutz - https://www.rechtsprechung-im-internet.de/jportal/portal/page/bsjrsprod.psml The corpus contains XML documents of the court decisions from seven federal courts (BAG, BFH, BGH, BPatG, BSG, BVerfG, BVerwG). Besides the unprocessed documents, the subset of verdicts are provided in aligned form (Moses/Giza++) according to ori...     »
Links:

Chair:

https://wwwmatthes.in.tum.de/pages/t5ma0jrv6q7k/sebis-Public-Website-Home

Used in order to train a deep learning classification model in the legal domain:

https://wwwmatthes.in.tum.de/pages/s4orjknmqls4/Master-s-Thesis-Christoph-Gebendorfer

 

Origin:

https://www.rechtsprechung-im-internet.de

Schlagworte:
legal-gcd; XML documents of german court decisions
Technische Hinweise:
Moses/Giza++ Format
View and download (406 MB, 3 files)
The data server also offers downloads with FTP
The data server also offers downloads with rsync (password m1446651):
rsync rsync://m1446651@dataserv.ub.tum.de/m1446651/
Sprache:
de
Rechte:
by, http://creativecommons.org/licenses/by/4.0
 BibTeX