Skalierung als alternative Datentransformation und deren Auswirkungen auf die Leistungsfähigkeit von Supervised Learning Algorithmen

Kauderer, Harald; Nakhaeizadeh, Gholamreza

doi:10.1007/978-3-642-86094-2_5

Harald Kauderer² &
Gholamreza Nakhaeizadeh²

Part of the book series: Beiträge zur Wirtschaftsinformatik ((WIRTSCH.INFORM.,volume 27))

787 Accesses
1 Citations

Zusammenfassung

Die Einordnung von Kreditkunden in unterschiedliche Bonitätsklassen sowie die Erstellung von Regelwerken, die eine automatische Entscheidung über die Annahme oder Ablehnung beantragter Kredite erlauben, gehören zu den Aufgaben, die mit Verfahren des Data Mining auf Basis vergangenheitsorientierter Daten gelöst werden können.

Die Bewertung der Kreditwürdigkeit eines Kunden erfolgt in aller Regel anhand von qualitativen und quantitativen Merkmalen, die bei der Beantragung eines Kredites erfaßt und dann mit Erfahrungswerten aus der Vergangenheit verglichen werden. Dieser Prozeß läßt sich prinzipiell mit Verfahren und Algorithmen des Supervised Learning modellieren.

Eine Reihe dieser Algorithmen, darunter auch einige statistische Verfahren und Neuronale Netze, lassen jedoch nur die Verarbeitung quantitativer, stetiger Merkmale zu. Um auch qualitative Merkmale in der Modellierung berücksichtigen zu können, müssen diese zuerst in quantitative Merkmale transformiert werden.

In diesem Beitrag wird neben der weit verbreiteten Binärkodierung die Skalierung als weitere Möglichkeit für die Transformation von qualitativen Daten in quantitative Daten betrachtet. Die transformierten Daten dienen in einem zweiten Schritt als Input für verschiedene Lernverfahren, mit denen jeweils ein Klassifikator für die Kreditwürdigkeitsprüfung erstellt wird. Abschließend werden die Auswirkungen der vorgestellten Datentransformationen auf die Leistungsfähigkeit verschiedener Lernverfahren auf Basis von realen Kreditdaten aus der Mobilfunkbranche ermittelt und gegenübergestellt.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Log in via an institution

Chapter: USD 29.95; Price excludes VAT (USA)

eBook: USD 44.99; Price excludes VAT (USA)

Softcover Book: USD 59.99; Price excludes VAT (USA)

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Literatur

Fahrmeir, L. und Hamerle, A. (Hrsg.) [1984]: Multivariate Statistische Verfahren. De Gruyter Verlag, Berlin
Google Scholar
Graf, J. & Nakhaeizadeh, G. [1994]: Credit Scoring Based on Neural and Machine Learning. In: Plantamura, Soucek, Visaggio (Hrsg.): Frontier Decision Support Concepts: Help Desk, Learning, Fuzzy Diagnoses, Quality Evaluation, Prediction, Evolution. John Wiley and Sons, New York
Google Scholar
Lautsch, E. [1993]: Binärdatenanalyse für Psychologen, Mediziner und Sozialwissenschaftler. Psychologie Verlags Union, Weinheim
Google Scholar
Michie, D.J, Spiegelhalter, D. M. und Taylor, C.C. (Hrsg.) [1994]: Machine Learning, Neural and Statistical Classification. Ellis Horwood, Chichester
Google Scholar
Nishisato, S. [1994]: Elements of Dual Scaling: An Introduction to Practical Data Analysis. Lawrence Erlbaum Associates, Hillsdale
Google Scholar
Nishisato, S. [1980]: Analysis of Categorical Data: Dual Scaling and its Applications. University of Toronto Press, Toronto
Google Scholar
Quinlan, J.R. [1993]: C4.5: Programs for Machine Learning. CA: Morgan Kaufmann, San Mateo
Google Scholar
Schulmeister, B. und Wysotzki, F. [1997]: DIPOL — A Hybrid Piecewise Linear Classifier. In: Nakhaeizadeh, G. & Taylor, C.C. (Hrsg.): Machine Learning and Statistics: The Interface. John Wiley and Sons, New York
Google Scholar

Download references

Author information

Authors and Affiliations

Forschung und Technik, F3S/E, Daimler-Benz AG, Postfach 23 60, D-89013, Ulm, Deutschland
Harald Kauderer & Gholamreza Nakhaeizadeh

Authors

Harald Kauderer
View author publications
You can also search for this author in PubMed Google Scholar
Gholamreza Nakhaeizadeh
View author publications
You can also search for this author in PubMed Google Scholar

Editor information

Editors and Affiliations

Forschung und Technik, Daimler-Benz AG, Postfach 2360, D-89013, Ulm, Deutschland
Gholamreza Nakhaeizadeh

Rights and permissions

Reprints and permissions

Copyright information

About this chapter

Cite this chapter

Kauderer, H., Nakhaeizadeh, G. (1998). Skalierung als alternative Datentransformation und deren Auswirkungen auf die Leistungsfähigkeit von Supervised Learning Algorithmen. In: Nakhaeizadeh, G. (eds) Data Mining. Beiträge zur Wirtschaftsinformatik, vol 27. Physica-Verlag HD. https://doi.org/10.1007/978-3-642-86094-2_5

Download citation

DOI: https://doi.org/10.1007/978-3-642-86094-2_5
Publisher Name: Physica-Verlag HD
Print ISBN: 978-3-7908-1053-0
Online ISBN: 978-3-642-86094-2
eBook Packages: Springer Book Archive

Publish with us

Policies and ethics