User: Guest  Login
Original title:
Improving Semantic Search in the German Legal Domain with Word Embeddings
Translated title:
Verbesserung der Semantischen Suche für die deutsche juristische Suche mit Word Embeddings
Author:
Landthaler, Jörg
Year:
2020
Document type:
Dissertation
Faculty/School:
Fakultät für Informatik
Advisor:
Matthes, Florian (Prof. Dr.)
Referee:
Matthes, Florian (Prof. Dr.); Ashley, Kevin D. (Prof., Ph.D.)
Language:
en
Subject group:
DAT Datenverarbeitung, Informatik; JUR Rechtswissenschaft; WIR Wirtschaftswissenschaften
Keywords:
Semantic Search, Query Expansion, German Legal Information Retrieval, Thesaurus Extension, Semantic Text Matching, Word Embeddings
Translated keywords:
Semantische Suche, Query Expansion, Deutsches juristisches Information Retrieval, Thesaurus Erweiterung, Semantic Text Matching, Word Embeddings
TUM classification:
WIR 523d; DAT 600d
Abstract:
This thesis investigates the use of word embeddings (word2vec, FastText, GloVe) to improve semantic search in legal documents. Word embeddings are successfully applied to find potential synonyms. Word embeddings also allow to perform query expansion for small text segments without maintaining a thesaurus which leads to better performance than traditional TF-IDF. A user study shows that a natural language search can be used as a complementary search method to traditional keyword search.
Translated abstract:
Diese Arbeit untersucht die Verwendung von Word Embeddings (word2vec, FastText, GloVe) zur Verbesserung der semantischen Suche in juristischen Dokumenten. Word Embeddings werden erfolgreich angewendet, um potenzielle Synonyme zu finden. Word Embeddings ermöglichen es, Query Expansion für kleine Textsegmente durchzuführen, ohne einen Thesaurus zu pflegen, was zu einer besseren Performance führt als herkömmliches TF-IDF. Eine Nutzerstudie zeigt, dass eine natürlichsprachliche Suche als ergänzende...     »
WWW:
https://mediatum.ub.tum.de/?id=1521744
Date of submission:
25.10.2019
Oral examination:
05.06.2020
File size:
5401117 bytes
Pages:
202
Urn (citeable URL):
https://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:91-diss-20200605-1521744-1-5
Last change:
14.08.2020
 BibTeX