Advertisement

Statistisches Fuzzy-Matching

  • Patrick Noll

Zusammenfassung

Aufbauend auf den Kapiteln 2 und 3 dieser Arbeit, in denen die notwendigen Grundlagen gelegt wurden, wird in diesem Kapitel eine neue Methode des statistischen Matchings entwickelt. In Anlehnung an den festgelegten Begriff „statistisches Matching“ wird die neue Methode des statistischen Matchings „statistisches Fuzzy-Matching“ genannt. Es stellt eine Kombination des statistischen Matchings mit der Fuzzy Logic dar und nutzt die Theorie der unscharfen Mengen, um Nachteile des gewöhnlichen Distanzmatchings auszugleichen:
  • Im Fall identischer Distanzen zwischen den Ausprägungen mehrerer Datensätze können Entscheidungen für statistische Zwillinge getroffen werden, wenn traditionelle Methoden keine Entscheidung finden können.

  • Statistisches Fuzzy-Matching erlaubt im Gegensatz zu traditionellen Distanzverfahren die differenzierte Betrachtung fehlender Werte in den Ausgangsdaten. Empirische Erhebungen enthalten neben fehlenden Werten durch einfache Auslassungen von Items zusätzlich noch verweigerte Angaben zu bestimmten Fragen („keine Angabe“) und Antworten wie „weiß ich nicht“, die durch fehlende Informationen oder fehlende Kompetenz zur qualifizierten Antwort entstehen können. Durch die Verwendung der Fuzzy Logic können diese Informationen differenziert verwendet und solche statistischen Zwillinge gefunden werden, die bspw. beide keine Angabe bei derselben Frage gemacht haben oder die beide keine Antwort auf die Frage wussten. Bei traditionellen Distanzverfahren des statistischen Matchings ist dies nicht oder nur sehr schwer möglich.

  • Nominal skalierte Variablen können direkt in die Bestimmung der Distanzen zwischen Datensätzen einbezogen werden. Bei traditionellen Distanzverfahren ist dies nur aufwändig möglich. Martens (2003) schlägt z. B. die Überführung nominal skalierter Variablen in dichotome bzw. binär-kodierte Daten vor und bestimmt die Distanz zwischen den Datensätzen anschließend mit Hilfe von Ähnlichkeitsmaßen auf Basis des Vorhandenseins der jeweiligen Eigenschaft bei keinem, einem oder beiden Objekten.

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Copyright information

© Vieweg+Teubner | GWV Fachverlage GmbH 2009

Authors and Affiliations

  • Patrick Noll

There are no affiliations available

Personalised recommendations