Zusammenfassung
Aufbauend auf den Kapiteln 2 und 3 dieser Arbeit, in denen die notwendigen Grundlagen gelegt wurden, wird in diesem Kapitel eine neue Methode des statistischen Matchings entwickelt. In Anlehnung an den festgelegten Begriff „statistisches Matching“ wird die neue Methode des statistischen Matchings „statistisches Fuzzy-Matching“ genannt. Es stellt eine Kombination des statistischen Matchings mit der Fuzzy Logic dar und nutzt die Theorie der unscharfen Mengen, um Nachteile des gewöhnlichen Distanzmatchings auszugleichen:
-
Im Fall identischer Distanzen zwischen den Ausprägungen mehrerer Datensätze können Entscheidungen für statistische Zwillinge getroffen werden, wenn traditionelle Methoden keine Entscheidung finden können.
-
Statistisches Fuzzy-Matching erlaubt im Gegensatz zu traditionellen Distanzverfahren die differenzierte Betrachtung fehlender Werte in den Ausgangsdaten. Empirische Erhebungen enthalten neben fehlenden Werten durch einfache Auslassungen von Items zusätzlich noch verweigerte Angaben zu bestimmten Fragen („keine Angabe“) und Antworten wie „weiß ich nicht“, die durch fehlende Informationen oder fehlende Kompetenz zur qualifizierten Antwort entstehen können. Durch die Verwendung der Fuzzy Logic können diese Informationen differenziert verwendet und solche statistischen Zwillinge gefunden werden, die bspw. beide keine Angabe bei derselben Frage gemacht haben oder die beide keine Antwort auf die Frage wussten. Bei traditionellen Distanzverfahren des statistischen Matchings ist dies nicht oder nur sehr schwer möglich.
-
Nominal skalierte Variablen können direkt in die Bestimmung der Distanzen zwischen Datensätzen einbezogen werden. Bei traditionellen Distanzverfahren ist dies nur aufwändig möglich. Martens (2003) schlägt z. B. die Überführung nominal skalierter Variablen in dichotome bzw. binär-kodierte Daten vor und bestimmt die Distanz zwischen den Datensätzen anschließend mit Hilfe von Ähnlichkeitsmaßen auf Basis des Vorhandenseins der jeweiligen Eigenschaft bei keinem, einem oder beiden Objekten.
This is a preview of subscription content, log in via an institution.
Buying options
Tax calculation will be finalised at checkout
Purchases are for personal use only
Learn about institutional subscriptionsPreview
Unable to display preview. Download preview PDF.
Rights and permissions
Copyright information
© 2009 Vieweg+Teubner | GWV Fachverlage GmbH
About this chapter
Cite this chapter
Noll, P. (2009). Statistisches Fuzzy-Matching. In: Statistisches Matching mit Fuzzy Logic. Vieweg+Teubner. https://doi.org/10.1007/978-3-8348-9586-8_4
Download citation
DOI: https://doi.org/10.1007/978-3-8348-9586-8_4
Publisher Name: Vieweg+Teubner
Print ISBN: 978-3-8348-0836-3
Online ISBN: 978-3-8348-9586-8
eBook Packages: Computer Science and Engineering (German Language)