Matthes, Florian (Prof. Dr.); Ashley, Kevin D. (Prof., Ph.D.)
Language:
en
Subject group:
DAT Datenverarbeitung, Informatik; JUR Rechtswissenschaft; WIR Wirtschaftswissenschaften
Keywords:
Semantic Search, Query Expansion, German Legal Information Retrieval, Thesaurus Extension, Semantic Text Matching, Word Embeddings
Translated keywords:
Semantische Suche, Query Expansion, Deutsches juristisches Information Retrieval, Thesaurus Erweiterung, Semantic Text Matching, Word Embeddings
TUM classification:
WIR 523d; DAT 600d
Abstract:
This thesis investigates the use of word embeddings (word2vec, FastText, GloVe) to improve semantic search in legal documents. Word embeddings are successfully applied to find potential synonyms. Word embeddings also allow to perform query expansion for small text segments without maintaining a thesaurus which leads to better performance than traditional TF-IDF. A user study shows that a natural language search can be used as a complementary search method to traditional keyword search.
Translated abstract:
Diese Arbeit untersucht die Verwendung von Word Embeddings (word2vec, FastText, GloVe) zur Verbesserung der semantischen Suche in juristischen Dokumenten. Word Embeddings werden erfolgreich angewendet, um potenzielle Synonyme zu finden. Word Embeddings ermöglichen es, Query Expansion für kleine Textsegmente durchzuführen, ohne einen Thesaurus zu pflegen, was zu einer besseren Performance führt als herkömmliches TF-IDF. Eine Nutzerstudie zeigt, dass eine natürlichsprachliche Suche als ergänzende Suchmethode zur herkömmlichen Stichwortsuche eingesetzt werden kann.
«
Diese Arbeit untersucht die Verwendung von Word Embeddings (word2vec, FastText, GloVe) zur Verbesserung der semantischen Suche in juristischen Dokumenten. Word Embeddings werden erfolgreich angewendet, um potenzielle Synonyme zu finden. Word Embeddings ermöglichen es, Query Expansion für kleine Textsegmente durchzuführen, ohne einen Thesaurus zu pflegen, was zu einer besseren Performance führt als herkömmliches TF-IDF. Eine Nutzerstudie zeigt, dass eine natürlichsprachliche Suche als ergänzende...
»