Skip to main content

Skalierung als alternative Datentransformation und deren Auswirkungen auf die Leistungsfähigkeit von Supervised Learning Algorithmen

Empirische Studie auf Basis realer Kreditdaten aus dem Mobilfunkgeschäft

  • Chapter
Data Mining

Part of the book series: Beiträge zur Wirtschaftsinformatik ((WIRTSCH.INFORM.,volume 27))

Zusammenfassung

Die Einordnung von Kreditkunden in unterschiedliche Bonitätsklassen sowie die Erstellung von Regelwerken, die eine automatische Entscheidung über die Annahme oder Ablehnung beantragter Kredite erlauben, gehören zu den Aufgaben, die mit Verfahren des Data Mining auf Basis vergangenheitsorientierter Daten gelöst werden können.

Die Bewertung der Kreditwürdigkeit eines Kunden erfolgt in aller Regel anhand von qualitativen und quantitativen Merkmalen, die bei der Beantragung eines Kredites erfaßt und dann mit Erfahrungswerten aus der Vergangenheit verglichen werden. Dieser Prozeß läßt sich prinzipiell mit Verfahren und Algorithmen des Supervised Learning modellieren.

Eine Reihe dieser Algorithmen, darunter auch einige statistische Verfahren und Neuronale Netze, lassen jedoch nur die Verarbeitung quantitativer, stetiger Merkmale zu. Um auch qualitative Merkmale in der Modellierung berücksichtigen zu können, müssen diese zuerst in quantitative Merkmale transformiert werden.

In diesem Beitrag wird neben der weit verbreiteten Binärkodierung die Skalierung als weitere Möglichkeit für die Transformation von qualitativen Daten in quantitative Daten betrachtet. Die transformierten Daten dienen in einem zweiten Schritt als Input für verschiedene Lernverfahren, mit denen jeweils ein Klassifikator für die Kreditwürdigkeitsprüfung erstellt wird. Abschließend werden die Auswirkungen der vorgestellten Datentransformationen auf die Leistungsfähigkeit verschiedener Lernverfahren auf Basis von realen Kreditdaten aus der Mobilfunkbranche ermittelt und gegenübergestellt.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 44.99
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
Softcover Book
USD 59.99
Price excludes VAT (USA)
  • Compact, lightweight edition
  • Dispatched in 3 to 5 business days
  • Free shipping worldwide - see info

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Literatur

  • Fahrmeir, L. und Hamerle, A. (Hrsg.) [1984]: Multivariate Statistische Verfahren. De Gruyter Verlag, Berlin

    Google Scholar 

  • Graf, J. & Nakhaeizadeh, G. [1994]: Credit Scoring Based on Neural and Machine Learning. In: Plantamura, Soucek, Visaggio (Hrsg.): Frontier Decision Support Concepts: Help Desk, Learning, Fuzzy Diagnoses, Quality Evaluation, Prediction, Evolution. John Wiley and Sons, New York

    Google Scholar 

  • Lautsch, E. [1993]: Binärdatenanalyse für Psychologen, Mediziner und Sozialwissenschaftler. Psychologie Verlags Union, Weinheim

    Google Scholar 

  • Michie, D.J, Spiegelhalter, D. M. und Taylor, C.C. (Hrsg.) [1994]: Machine Learning, Neural and Statistical Classification. Ellis Horwood, Chichester

    Google Scholar 

  • Nishisato, S. [1994]: Elements of Dual Scaling: An Introduction to Practical Data Analysis. Lawrence Erlbaum Associates, Hillsdale

    Google Scholar 

  • Nishisato, S. [1980]: Analysis of Categorical Data: Dual Scaling and its Applications. University of Toronto Press, Toronto

    Google Scholar 

  • Quinlan, J.R. [1993]: C4.5: Programs for Machine Learning. CA: Morgan Kaufmann, San Mateo

    Google Scholar 

  • Schulmeister, B. und Wysotzki, F. [1997]: DIPOL — A Hybrid Piecewise Linear Classifier. In: Nakhaeizadeh, G. & Taylor, C.C. (Hrsg.): Machine Learning and Statistics: The Interface. John Wiley and Sons, New York

    Google Scholar 

Download references

Author information

Authors and Affiliations

Authors

Editor information

Editors and Affiliations

Rights and permissions

Reprints and permissions

Copyright information

© 1998 Physica-Verlag Heidelberg

About this chapter

Cite this chapter

Kauderer, H., Nakhaeizadeh, G. (1998). Skalierung als alternative Datentransformation und deren Auswirkungen auf die Leistungsfähigkeit von Supervised Learning Algorithmen. In: Nakhaeizadeh, G. (eds) Data Mining. Beiträge zur Wirtschaftsinformatik, vol 27. Physica-Verlag HD. https://doi.org/10.1007/978-3-642-86094-2_5

Download citation

  • DOI: https://doi.org/10.1007/978-3-642-86094-2_5

  • Publisher Name: Physica-Verlag HD

  • Print ISBN: 978-3-7908-1053-0

  • Online ISBN: 978-3-642-86094-2

  • eBook Packages: Springer Book Archive

Publish with us

Policies and ethics