Auszug
Duplikate sind eines der prominentesten Beispiele für Datenqualitätsprobleme in einem Datenbestand und spielen vor allem bei der Integration von sich überlappenden Informationsbeständen eine wichtige Rolle. Das folgende Kapitel gibt Aufschluss über die Entstehung und die Folgen von Dubletten, stellt ein allgemein gültiges Modell zur Vorgehensweise der Duplikatidentifizierung vor und geht im Anschluss auf die größten Schwierigkeiten bei der Dublettensuche ein.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
Rights and permissions
Copyright information
© 2009 Vieweg+Teubner | GWV Fachverlage GmbH, Wiesbaden
About this chapter
Cite this chapter
(2009). Duplikate in Datenbeständen. In: Webbasierte Datenintegration. Vieweg+Teubner. https://doi.org/10.1007/978-3-8348-9280-5_11
Download citation
DOI: https://doi.org/10.1007/978-3-8348-9280-5_11
Publisher Name: Vieweg+Teubner
Print ISBN: 978-3-8348-0723-6
Online ISBN: 978-3-8348-9280-5
eBook Packages: Computer Science and Engineering (German Language)