Zusammenfassung
Die Einordnung von Kreditkunden in unterschiedliche Bonitätsklassen sowie die Erstellung von Regelwerken, die eine automatische Entscheidung über die Annahme oder Ablehnung beantragter Kredite erlauben, gehören zu den Aufgaben, die mit Verfahren des Data Mining auf Basis vergangenheitsorientierter Daten gelöst werden können.
Die Bewertung der Kreditwürdigkeit eines Kunden erfolgt in aller Regel anhand von qualitativen und quantitativen Merkmalen, die bei der Beantragung eines Kredites erfaßt und dann mit Erfahrungswerten aus der Vergangenheit verglichen werden. Dieser Prozeß läßt sich prinzipiell mit Verfahren und Algorithmen des Supervised Learning modellieren.
Eine Reihe dieser Algorithmen, darunter auch einige statistische Verfahren und Neuronale Netze, lassen jedoch nur die Verarbeitung quantitativer, stetiger Merkmale zu. Um auch qualitative Merkmale in der Modellierung berücksichtigen zu können, müssen diese zuerst in quantitative Merkmale transformiert werden.
In diesem Beitrag wird neben der weit verbreiteten Binärkodierung die Skalierung als weitere Möglichkeit für die Transformation von qualitativen Daten in quantitative Daten betrachtet. Die transformierten Daten dienen in einem zweiten Schritt als Input für verschiedene Lernverfahren, mit denen jeweils ein Klassifikator für die Kreditwürdigkeitsprüfung erstellt wird. Abschließend werden die Auswirkungen der vorgestellten Datentransformationen auf die Leistungsfähigkeit verschiedener Lernverfahren auf Basis von realen Kreditdaten aus der Mobilfunkbranche ermittelt und gegenübergestellt.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
Literatur
Fahrmeir, L. und Hamerle, A. (Hrsg.) [1984]: Multivariate Statistische Verfahren. De Gruyter Verlag, Berlin
Graf, J. & Nakhaeizadeh, G. [1994]: Credit Scoring Based on Neural and Machine Learning. In: Plantamura, Soucek, Visaggio (Hrsg.): Frontier Decision Support Concepts: Help Desk, Learning, Fuzzy Diagnoses, Quality Evaluation, Prediction, Evolution. John Wiley and Sons, New York
Lautsch, E. [1993]: Binärdatenanalyse für Psychologen, Mediziner und Sozialwissenschaftler. Psychologie Verlags Union, Weinheim
Michie, D.J, Spiegelhalter, D. M. und Taylor, C.C. (Hrsg.) [1994]: Machine Learning, Neural and Statistical Classification. Ellis Horwood, Chichester
Nishisato, S. [1994]: Elements of Dual Scaling: An Introduction to Practical Data Analysis. Lawrence Erlbaum Associates, Hillsdale
Nishisato, S. [1980]: Analysis of Categorical Data: Dual Scaling and its Applications. University of Toronto Press, Toronto
Quinlan, J.R. [1993]: C4.5: Programs for Machine Learning. CA: Morgan Kaufmann, San Mateo
Schulmeister, B. und Wysotzki, F. [1997]: DIPOL — A Hybrid Piecewise Linear Classifier. In: Nakhaeizadeh, G. & Taylor, C.C. (Hrsg.): Machine Learning and Statistics: The Interface. John Wiley and Sons, New York
Author information
Authors and Affiliations
Editor information
Editors and Affiliations
Rights and permissions
Copyright information
© 1998 Physica-Verlag Heidelberg
About this chapter
Cite this chapter
Kauderer, H., Nakhaeizadeh, G. (1998). Skalierung als alternative Datentransformation und deren Auswirkungen auf die Leistungsfähigkeit von Supervised Learning Algorithmen. In: Nakhaeizadeh, G. (eds) Data Mining. Beiträge zur Wirtschaftsinformatik, vol 27. Physica-Verlag HD. https://doi.org/10.1007/978-3-642-86094-2_5
Download citation
DOI: https://doi.org/10.1007/978-3-642-86094-2_5
Publisher Name: Physica-Verlag HD
Print ISBN: 978-3-7908-1053-0
Online ISBN: 978-3-642-86094-2
eBook Packages: Springer Book Archive