Advertisement

Ein Jackknife-Ansatz zur Strukturextraktion in Multilayer-Perceptrons bei kleinen Datenmengen

  • Thorsten Poddig

Zusammenfassung

Seit ihrer ersten, aus heutiger Sicht mehr oder weniger unspezifischen Anwendung Künstlicher Neuronaler Netzwerke (KNN) auf finanzwirtschaftliche Problemstellungen1, wurden im Laufe der Zeit die spezifischen Probleme bei ökonomischen Aufgabenstellungen immer deutlicher. Eines der Kernprobleme stellt hier die zumeist geringe, teilweise sogar sehr geringe Datenmenge für das Training des KNN dar. Ein repräsentatives Beispiel aus dem Bereich der fundamentalen Wechselkursprognose möge dies illustrieren: Viele wesentliche fundamentale Einflußfaktoren wie z.B. Produktionsindices, Beschäftigungsindices, Preisindices, Handelbilanzsaldo, Staatsverschuldung usw. liegen bestenfalls als Reihen monatlicher Daten, oftmals aber nur als Quartals- oder Jahresdaten vor. Weit in die Vergangenheit zurückreichend sind diese Daten selten erhältlich, oftmals würde es überdies auch sachlogisch wenig Sinn ergeben, allzuweit in die Vergangenheit zurückreichende Daten zu erheben. Bei Wechselkursprognosen wäre es z.B. sinnlos, weiter als bis 1973 (Zusammenbruch des Systems fester Wechselkurse) zurückliegende Daten zu erheben. Da in diesem Beispiel die 70er ferner von erheblichen Anpassungsvorgängen an das System flexibler Wechselkurse gekennzeichnet waren, würde man wahrscheinlich nicht weiter als bis 1980 zurückliegend gehen. Auf Basis von Quartalsdaten würden sich (bis 1992) 48, auf Basis von Monatsdaten 144 Datensätze ergeben. Will man die Prognosefähigkeit des KNN später testen, sind von den 48 (144) Datensätzen z.B. 18 (64) zu entfernen (um eine willkürliche Zahl zu wählen). Die Anzahl der verbleibenden 30 (80) Datensätze stellt schon oftmals bei der Anwendung statistischer Verfahren ein ernsthaftes Problem dar, hier zu validen und stabilen Parameterschätzungen zu gelangen. Aufgrund der deutlich höheren Anzahl von Freiheitsgraden in einem KNN stellt dies hier jedoch ein ungleich ernsthafteres Problem dar. Das leidige Phänomen des “Overfitting” als natürliche Folge der beschriebenen Umstände ist hier zum allseits bekannten Schlagwort geworden.

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Literaturverzeichnis

  1. Crask, M.R.; Perreault, W.D. (1977): Validation of Discriminant Analysis in Marketing Research, Journal of Marketing Research, Vol. XIV, February 1977, S. 60 ff.CrossRefGoogle Scholar
  2. Finnoff, W.; Zimmermann, H.G. (1992): Detecting Structure in Small Datasets by Network Fitting and Complexity Constraints, Siemens AG, Corporate Research and Development, München.Google Scholar
  3. Hergert, F.; Finnoff, W.; Zimmermann, H.G. (1992): A Comparison of Weight Elimination Methods for Reducing Complexitiy in Neural Networks, Siemens AG, Corporate Research and Development, München.Google Scholar
  4. Hertz, J.; Krogh, A.; Palmer, R. (1991): Introduction to the Theory of Neural Computation, Addision-Wesley, Redwood City, CA.Google Scholar
  5. Huberman, B.; Rumelhart, D.; Weigend, A. (1991): Generalisation by Weight Elimination with Application to Forecasting, in: Lippmann, R.P.; Moody, J.: Advances in Neural Information Processing III, Morgan Kaufmann.Google Scholar
  6. Mosteller, F.; Tukey, J.W. (1968): Data Analysis, Including Statistics, in: Lindzey, G.; Aronson, E.: The Handbook of Social Psychology, 2nd Edition, Addison-Wesley, Reading, Ma, S. 80 ff.Google Scholar
  7. Rehkugler, H.; Poddig, Th. (1992): Klassifikation von Jahresabschlüssen mittels Multilayer-Perceptrons, — Erste Ergebnisse und weiterführende Fragestellungen-, Bamberger Betriebswirtschaftliche Beiträge, Bamberg.Google Scholar
  8. Rehkugler, H.; Poddig, Th. (1993): Kurzfristige Wechselkursprognosen mit Künstlichen Neuronalen Netzwerken, 4. Karlsruher Ükonometrie-Workshop: Finanzmarktanwendungen Neuronaler Netze und Ükonometrischer Verfahren, 4. — 5. März 1993, Universität Karlsruhe (Tagungsband in Vorbereitung).Google Scholar
  9. Weigend, A.S.; Huberman, B.A.; Rumelhart, D.E. (1990): Predicting the Future: A Connectionist Approach, Standford University, Stanford, CA.Google Scholar
  10. White, H. (1988): Economic prediction using neural networks: The case of IBM daily stocks returns, in: IEEE International Conference on Neural Networks, San Diego, Ca, S. II-451 ff.Google Scholar

Copyright information

© Betriebswirtschaftlicher Verlag Dr. Th. Gabler GmbH, Wiesbaden 1994

Authors and Affiliations

  • Thorsten Poddig

There are no affiliations available

Personalised recommendations