Benutzer: Gast  Login
Mehr Felder
Einfache Suche
Originaltitel:
Improving Semantic Search in the German Legal Domain with Word Embeddings
Übersetzter Titel:
Verbesserung der Semantischen Suche für die deutsche juristische Suche mit Word Embeddings
Autor:
Landthaler, Jörg
Jahr:
2020
Dokumenttyp:
Dissertation
Fakultät/School:
Fakultät für Informatik
Betreuer:
Matthes, Florian (Prof. Dr.)
Gutachter:
Matthes, Florian (Prof. Dr.); Ashley, Kevin D. (Prof., Ph.D.)
Sprache:
en
Fachgebiet:
DAT Datenverarbeitung, Informatik; JUR Rechtswissenschaft; WIR Wirtschaftswissenschaften
Stichworte:
Semantic Search, Query Expansion, German Legal Information Retrieval, Thesaurus Extension, Semantic Text Matching, Word Embeddings
Übersetzte Stichworte:
Semantische Suche, Query Expansion, Deutsches juristisches Information Retrieval, Thesaurus Erweiterung, Semantic Text Matching, Word Embeddings
TU-Systematik:
WIR 523d; DAT 600d
Kurzfassung:
This thesis investigates the use of word embeddings (word2vec, FastText, GloVe) to improve semantic search in legal documents. Word embeddings are successfully applied to find potential synonyms. Word embeddings also allow to perform query expansion for small text segments without maintaining a thesaurus which leads to better performance than traditional TF-IDF. A user study shows that a natural language search can be used as a complementary search method to traditional keyword search.
Übersetzte Kurzfassung:
Diese Arbeit untersucht die Verwendung von Word Embeddings (word2vec, FastText, GloVe) zur Verbesserung der semantischen Suche in juristischen Dokumenten. Word Embeddings werden erfolgreich angewendet, um potenzielle Synonyme zu finden. Word Embeddings ermöglichen es, Query Expansion für kleine Textsegmente durchzuführen, ohne einen Thesaurus zu pflegen, was zu einer besseren Performance führt als herkömmliches TF-IDF. Eine Nutzerstudie zeigt, dass eine natürlichsprachliche Suche als ergänzende...     »
WWW:
https://mediatum.ub.tum.de/?id=1521744
Eingereicht am:
25.10.2019
Mündliche Prüfung:
05.06.2020
Dateigröße:
5401117 bytes
Seiten:
202
Urn (Zitierfähige URL):
https://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:91-diss-20200605-1521744-1-5
Letzte Änderung:
14.08.2020
 BibTeX