Auszug
Auf Grund der Integration großer heterogener Datenmengen sind Probleme, wie sie in Kapitel 2 im Abschnitt Datenfehler 2.2 aufgeführt wurden, zu bewältigen. Der Prozess der Identifikation und Berichtigung von Fehlern und Inkonsistenzen mit dem Ziel, die Qualität einer vorgegebenen Datenmenge zu erhöhen wird als Data Cleaning (in der Literatur auch data scrubbing oder data cleansing [LN07]) bezeichnet. Der Data Cleaning Prozess lässt sich grob wie folgt gliedern:
-
1.
Definieren und Bestimmen des eigentlichen Problems
-
2.
Suchen und Identifizieren von fehlerhaften Instanzen
-
3.
Korrektur der gefundenen Fehler
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
Rights and permissions
Copyright information
© 2009 Vieweg+Teubner | GWV Fachverlage GmbH, Wiesbaden
About this chapter
Cite this chapter
(2009). Data Cleaning. In: Webbasierte Datenintegration. Vieweg+Teubner. https://doi.org/10.1007/978-3-8348-9280-5_4
Download citation
DOI: https://doi.org/10.1007/978-3-8348-9280-5_4
Publisher Name: Vieweg+Teubner
Print ISBN: 978-3-8348-0723-6
Online ISBN: 978-3-8348-9280-5
eBook Packages: Computer Science and Engineering (German Language)