User: Guest  Login
Original title:
Dublettenerkennung 
Original subtitle:
Ähnlichkeitsmaße und Verfahren 
Translated title:
Searching for Duplicates 
Year:
2007 
Document type:
Dissertation 
Institution:
Fakultät für Informatik 
Advisor:
Mayr, Ernst W. (Prof. Dr.) 
Referee:
Mayr, Ernst W. (Prof. Dr.) 
Language:
de 
Subject group:
DAT Datenverarbeitung, Informatik 
Abstract:
In großen, ständig wachsenden bibliographischen Datenbanken kann es nicht ausgeschlossen werden, dass einzelne Artikel oder sogar komplette Zeitschriften doppelt erfasst werden. Diese Dubletten zu erkennen erfordern zum einen geeignete Methoden, die entscheiden, ob zwei Datensätze identisch sind und zum andern Verfahren, die die Anzahl der nötigen Vergleiche, um diese Dubletten zu finden, minimieren. In dieser Arbeit wird das Sliding Window* Verfahren vorgestellt, eine Erweiterung des Sliding...    »
 
Translated abstract:
In large and continuously growing bibliographic databases it cannot be avoided that individual articles or even entire magazines are twice. In order to detect such duplicates on the one hand needs a method which can decide whether two records are identical. On the other hand one needs to find an appropriate algorithm which minimizes the number of comparisons needed to find those duplicates. In this thesis the Sliding Window* procedure is presented. It is an extension to the Sliding Window pr...    »
 
Oral examination:
26.11.2007 
Pages:
124 
Last change:
25.02.2008