Advertisement

Mathematisch basierte Diskussion der Prognoseverfahren

  • Martin Busshart
  • Matthias F. F. Maneth
  • Roland Eisen

Zusammenfassung

Für den mathematisch orientierten Vergleich der verschiedenen Verfahren wird als Basisfaktor die Prognosegüte gewählt, da die Prognosen als Grundlage für Entscheidungen dienen. Darauf aufbauend stehen eine Vielzahl von Kriterien zur Beurteilung und Auswahl von Prognoseverfahren zur Verfügung.

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Literatur

  1. Vgl. Armstrong (1978), S. 368f., S. 376f. und S. 383.Google Scholar
  2. Vgl. zur Darstellung dieser Bewertungsproblematik Armstrong (1978), S. 273ff.Google Scholar
  3. Vgl. Griese/Eckardt (1994), S. 92ff., Makridakis/Wheelwright (1977), S. 20, Brockhoff (1977), S. 52 und S. 54 und Theil (1961), S. 22f. Eine Schätzung des möglichen stochastischen Fehlers kann durch die Angabe von Intervallprognosen und des Prognosekanals erfolgen. Vgl. Schwarze (1973b), S. 334 und Lewandowski (1974), S. 196ff.Google Scholar
  4. Vgl. Scheer (1983), S. 20, Steece (1982), S. 458f., Fildes (1992), S. 81ff., Brockhoff (1977), S. 60f., Theil (1975), S. 15ff. und Fischer (1980), S. 183.Google Scholar
  5. Vgl. Schwarze (1980), S. 318f. und Makridakis/Wheelwright (1977), S. 21f. Auf die Konstruktion von “Tracking-Signalen”, die anhand von Abweichungen eine Modellanpassung indizieren, und die (manuelle oder automatische) Modellanpassung selbst kann nicht weiter eingegangen werden. Vgl. hierzu Lewandowski (1974), S. 119ff., Lewis (1982), S. 225ff., Mintrop (1972), S. 302f. und Brown (1963), S. 296ff.Google Scholar
  6. Vgl. zur ex ante-Beurteilung Brockhoff (1977), S. 52ff. Dabei ist zu beachten, daß ein gut an die vergangene Zeitreihenentwicklung angepaßtes Beschreibungsmodell nicht zwangsläufig auch ein gutes Prognosemodell darstellt. Zur Modellanalyse und -kritik mittels eines Slrukturstabilitätstests, der Theilschen Zerlegung und einem Test für den Informationsinhalt des Modells vgl. Steece (1982), S. 458 und S. 462ff.Google Scholar
  7. Vgl. Merz (1980), S. 32. Bei der ex post-Beurteilung wird ein Teil der Zeitreihe zur Modell-und Parameterschätzung und der andere Teil zum Test der Güte dieses Modells verwendet. Vgl. Hüttner (1986), S. 257f.Google Scholar
  8. Vgl. Theil (1975), S. 19ff., Lewandowski (1974), S. 121ff., Brockhoff (1977), S. 57ff., Merz (1980), S. 32f. und Hüttner (1986), S. 265f.Google Scholar
  9. Merz (1980), S. 34. Vgl. auch die Darstellungen bei Theil (1975), S. 21ff. und ders. (1961), S. 28ff.Google Scholar
  10. Vgl. Theil (1961), S. 29f., ders. (1975), S. 23f., Schwarze (1980), S. 322 und Merz (1980), S. 35.Google Scholar
  11. Vgl. hierzu und weiterfiihrend Merz (1980), S. 35ff. Vgl. außerdem Theil (1961), S. 114ff.Google Scholar
  12. Quelle: Merz (1980), S. 36, Tab. 2.1. Vgl. auch Theil (1975), S. 22f. und Schwarze (1980), S. 321f.Google Scholar
  13. Vgl. Merz (1980), S. 36f. und Schwarze (1980), S. 327. Der Fall, daß kein Umkehrpunkt prognostiziert und auch keiner realisiert wurde (Klasse (iv)), spielt bei diesen Fehlermaßen keine Rolle. Vgl. Brockhoff (1977), S. 60 Vgl. Hansmann (1983), S. 17 und Merz (1980), S. 37.Vgl. Hansmann (1983), S. 17 und Merz (1980), S. 37.Google Scholar
  14. Vgl. Schwarze (1980), S. 323ff., ders. (1973a), S. 537ff., Hüttner (1986), S. 257ff., ders. (1994), S. 350 und Mintrop (1972), S. 302.Google Scholar
  15. Vgl. zu den folgenden und zu weiteren Fehlermaßen wie z.B. dem Bestimmtheitsmaß und dem Variationskoeffizienten Hühner (1994), S. 350f., Schwarze (1973a), S. 537ff., Amistrong/Collopy (1992), S. 78f., Armstrong (1978), S. 320f., Emde (1977), S. 203f. und Brockhoff (1977), S. 55.Google Scholar
  16. Vgl. Makridakis/Wheelwright (1977), S. 20f. Allerdings kann dieses Vorgehen zu verzerrten Ergebnissen führen, wenn die große Abweichung auf einer singulären Störung beruht, vgl. Hansmann (1983), S. 15.Google Scholar
  17. Vgl. Hüttner (1994), S. 351 und Steece (1982), S. 459.Google Scholar
  18. Vgl. Hüttner (1994), S. 351 und Steece (1982), S. 460.Google Scholar
  19. Lediglich die Aussage, es liege eine “ideale Prognose” vor, wenn die Fehlermaße jeweils den Wert Null annehmen, kann getroffen werden. Vgl. Hansmann (1983), S. 15f.Google Scholar
  20. Vgl. Theil (1961), S. 31ff., ders. (1975), S. 26ff., Scheer (1983), S. 22 und Hüttner (1986), S. 262ff. Zum ähnlich konstruierten Januskoeffizient J, mit dem ex post Einflüsse auf die Gültigkeit der Zeitstabilitätshypothese erkannt werden können, vgl. S.hwarze (1973b), S. 335 und Schwarze (1980), S. 340. Vgl. außerdem zu weiteren problembezogenen, abgeleiteten Fehlermaßen Brockhoff (1977), S. 56f.Google Scholar
  21. Vgl. Theil (1975), S. 28 und Merz (1980), S. 40.Google Scholar
  22. Vgl. Theil (1975), S. 28. Im Zusammenhang mit dem Theilschen Ungleichheitskoeffizienten ist besonders auf eine genaue Ausdrucksweise zu achten, da Theil verschiedene Versionen dieses Koeffizienten vorgeschlagen hat, die von einigen Autoren ohne explizite Kenntlichmachung übernommen und abgeändert wurden. Vgl. Theil (1975), S. 28, Fn. 1, Schwarze (1980), S. 333ff., Armstrong (1978), S. 322 und Brockhoff (1977), S. 59, Fn. 20 und 21.Google Scholar
  23. Vgl. Theil (1975), S. 28, Niederhübner (1994), S. 209, Merz (1980), S. 41, Steece (1982), S. 460f. und Emde (1977), S. 204ff. Eine Obergrenze für U existiert nicht.Google Scholar
  24. Vgl. Hansmann (1983), S. 16 und Steece (1982), S. 461..Google Scholar
  25. Die Vielzahl der verwendeten Fehlermaße und die durch ungenaue Abgrenzungen oft auftretende Verwirrung wird bei Schwarze (1980), S. 328ff. anschaulich aufgezeigt.Google Scholar
  26. Vgl. Hüttner (1994), S. 352 und Makridakis/Hibon (1979), S. 97ff.Google Scholar
  27. Vgl. Makridakis (1993), S. 527ff. und Hüttner (1994), S. 352 sowie die dort genannte Literatur. Vgl. zur Berechnung des MdAPE und des GRMSE für 191 prognostizierte Reihen Armstrong/Collopy (1992), S. 69ff.Google Scholar
  28. Vgl. weiterführend Hüttner (1994), S. 351f.Google Scholar
  29. Es erfolgt eine Beschränkung auf die Darstellung der Kriterien. Für deren ausführliche Analyse wird auf die umfangreiche Literatur hierzu verwiesen. Stellvertretend sei genannt Makridakis/Wheelwright (1977), S. 15ff. und S. 203ff., Hüttner (1986), S. 279ff., Brockhoff (1977), S. 51 ff. und Hansmann (1983), S. 141ff.Google Scholar
  30. Vgl. Steece (1982), S. 466f. und Hüttner (1986), S. 280.Google Scholar
  31. Vgl. Makridakis/Wheelwright (1977), S. 219f. und Brockhoff (1977), S. 51.Google Scholar
  32. Vgl. Makridakis/Wheelwright (1977), S. 228ff.Google Scholar
  33. Vgl. zu den dabei immer wieder auftretenden Problemen Mahmoud et al. (1992), S. 253ff., Remus/Simkin (1982), S. 505ff. und Schütze (1994), S. 233f.Google Scholar
  34. Vgl. Fildes (1982), S. 84ff., Makridakis/Wheelwright (1977), S. 239, Schwebler (1970), S. 652, Obermeier (1977), S. 159ff. und S. 227ff. und Schütze (1994), S. 234ff.Google Scholar
  35. Vgl. Makridakis/Wheelwright (1977), S. 217 und Brockhoff (1977), S. 51f.Google Scholar
  36. Vgl. Makridakis/Hibon (1979), S. 97 und Makridakis et al. (1982), S. 112.Google Scholar
  37. Vgl. Makridakis (1993), S. 527ff. und Hüttner (1986), S. 270. Auch der Vergleich anhand synthetischer, d.h. künstlich erzeugter Datenreihen kann zur Beurteilung der Fähigkeit, das Grundmuster einer Reihe zu identifizieren, sehr hilfreich sein, da künstliche Reihen ohne überlagernde Zufallsschwankungen konstruiert werden können. Auch zum Test der Fähigkeit, zwischen Muster und Zufall zu unterscheiden, sind die künstlichen Reihen zumindest nicht schlechter geeignet, da dort die Zufallseinflüsse kontrolliert und experimentell verändert werden können. Vgl. Makridakis/Wheelwright (1977), S. 221.1 Vgl. für einen Überblick Dawes/Fildes/Lawrence/Ord (1994), S. 153f., Mahmoud (1984), S. 140f£, Hüttner (1986), S. 270ff. und Makridakis et al. (1982), S. 112.Google Scholar
  38. Vgl. Kolb/Stekler (1993), S. 117ff. Über auffallend schlechte Ergebnisse mit der exponentiellen Glättang berichtet dagegen Fildes (1992), S. 85ff..Google Scholar
  39. Vgl Jenkins (1979), S. 30ff., Mahmoud/Pegels (1990), S. 50f. und Makridakis et al. (1982), S. 112.Google Scholar
  40. Ansätze hierzu findet man bei O’Connor/Remus/Griggs (1993), S. 163ff. und Goodwin/Wright (1993), S. 147ff. Ökonometrische Modelle wurden daher ebenfalls kaum berücksichtigt. Einige Studien bescheinigten aber z.B. ARMA-Modellen eine mindestens ebenso gute Genauigkeit wie den nochmals wesentlich komplexeren ökonometrischen Modellen. Vgl. Makridakis/Hibon (1979), S. 97ff.Google Scholar
  41. Vgl. Newbold/Granger (1974), S. 137ff. Für die Darstellung der Ergebnisse dieses Vergleichs wird auf die Kennzeichnung sinngemäßer Zitate aus dieser Quelle verzichtet. Die folgenden Berechnungen und Graphiken beruhen auf dem Datenmaterial der Tab. 1 und 2 auf S. 138 dieser Quelle.Google Scholar
  42. Beim zweiparametrigen exponentiellen H/W-Glättungsverfahren werden Grund-und Trendwert unterschiedlich geglättet und fortgeschrieben. Vgl. Schröder (1994), S. 36f. und Chatfield/Yar (1991), S. 31 ff.Google Scholar
  43. Bei der SAR handelt es sich um ein exponentielles Glättungsverfahren, bei dem anhand des Datenmaterials in mehreren Algorithmen ein autoregressives Prognosemodell iterativ erstellt wird. Vgl. zu Einzelheiten Newbold/Granger (1974), S. 134f.Google Scholar
  44. Allerdings wurden in anderen Untersuchungen zum Teil weniger signifikante Ergebnisse beim Vergleich von Glättungsverfahren mit der ARMA-Methode erzielt. Vgl. Makridakis/Hibon (1979), S. 98f und die dort angegebene Literatur.Google Scholar
  45. Ähnliche Schlußfolgerungen fir die Performance des B/J-Verfahrens findet man bei Fischer (1980), S. 199ff.Google Scholar
  46. Vgl., da die Originalquelle von Reid nicht eingesehen werden konnte, Mohr (1976), S. 2.Google Scholar
  47. Vgl. Schläger (1994), S. 41ff., Winters (1960), S. 325f. und Newbold/Granger (1974), S. 137ff. Beim Harrison-Verfahren wird die Saisonkomponente nicht durch einen Vektor von Saisonfaktoren, sondern durch signifikante Fourier-Koeffizienten dargestellt. Vgl. Schläger (1994), S. 46ff.Google Scholar
  48. Die Darstellung dieses Verfahrensvergleichs und der daraus gewonnenen Erkenntnisse basiert auf Makridakis/Hibon (1979). Es wird darauf hingewiesen, daß sinngemäße Zitate aus dieser Quelle in diesem Zusammenhang nicht einzeln gekennzeichnet wurden. Die verschiedenen angewendeten Saisonbereinigungs-und Prognoseverfahren sowie die berechneten Fehlermaße sind dort im Anhang, S.Google Scholar
  49. Unterschiede in der relativen Genauigkeit der Verfahren, die allein auf die Auswahl der Zeitreihen zurückzuführen sind, sollten dadurch vermieden werden, damit die später erzielten Ergebnisse verallgemeinert werden konnten.Google Scholar
  50. Diese Ermittlung von Rangplätzen erfolgte, um die Ergebnisse mit denen von Newbold/Granger vergleichen zu können, vgl. Kap. 2.2.2.Google Scholar
  51. Mittlerweile existiert eine weiterentwickelte und offensichtlich verbesserte Version des Harrison-Verfahrens. Vgl. hierzu die Ergebnisse bei Mahmoud/Pegels (1990), S. 52ff.Google Scholar
  52. Diese Erkenntnis, daß der Zufallsanteil einer Zeitreihe die relative Performance der einzelnen Prognoseverfahren unterschiedlich stark beeinflußt, wird später nochmals aufgegriffen.Google Scholar
  53. Übereinstimmende Ergebnisse erzielten beispielsweise auch Mahmoud/Pegels (1990), S. 55f.Google Scholar
  54. Die Koeffizienten wurden dabei zum 99%-Signifikanzniveau gegen die t-bzw. die F-Verteilung getestet.Google Scholar
  55. Zur Untersuchung der Performance eines konkret interessierenden Verfahrens im Vergleich zu allen übrigen wird auf die Zusammenstellung aller Regressionskoeffizienten bei Makridakis/Hibon (1979), S. 111f., Tab. 9 und 10, verwiesen.Google Scholar
  56. Vgl. Makridakis/Hibon (1979), S. 115, die dort vom “hedgen” der Prognose sprechen.Google Scholar
  57. Vgl. Hüttner (1994), S. 363, Makridakis/Hibon (1991), S. 321ff. und Thompson (1991), S. 331ff.Google Scholar
  58. Möglicherweise kann dies durch “over-fitting” bei der Modellspezifikation erklärt werden, d.h., daß die Trendkomponente überschätzt wurde bzw. daß zu sehr nach einem Trend “gesucht” wurde. Die gung stehenden Zeitreihenwerte kaum zu einer Verbesserung der relativen Performance der Verfahren führte, konnte bestätigt werden.Google Scholar
  59. Vgl. zu Aufbau, Durchführung und Ergebnissen der M2-Competition Makridakis et al. (1993).Google Scholar
  60. Vgl. Makridakis et al. (1993), S. 14ff.Google Scholar
  61. Eine ebenfalls recht große Untersuchung wurde von Emde durchgeführt und ausführlich dokumentiert. Vgl. Emde (1977), S. 178ff.Google Scholar
  62. Allerdings wurden nicht alle Reihen mit allen Verfahren prognostiziert. Gründe hierfiir betrafen den Aufwand und die teilweise offensichtliche Nichteignung mancher Verfahren für bestimmte Reihen.Google Scholar
  63. Vgl. für eine ausführliche Dokumentation des Vergleichs und der Ergebnisse Schwarze/Weckerle (1982). Vgl. außerdem Hüttner (1994), S. 350 und S. 362.Google Scholar
  64. Vgl. Hüttner (1994), S. 351f.Google Scholar
  65. Solche Untersuchungen werden z.B. von der DGVM, I.A.A., ASTIN und VSVM sowie diversen Fachausschüssen und Verbänden der Versicherungswirtschaft durchgeführt. Vgl. auch Helten (1983), S. 1282.Google Scholar
  66. Eine Ausnahme bildet der relativ klein angelegte Verfahrensvergleich bei Emde (1980), S. 93ff. Die Ergebnisse stimmen mit denen der folgenden Zusammenfassung überein. Vgl. Emde (1980), S. 103.Google Scholar
  67. Vgl. Helten (1981b), S. 361f.Google Scholar
  68. Vgl. Jaeger (1983), S. 178ff., ders. (1984), S. 322ff., Sticker/Kuon (1988), S. 579, Dickmann (1988), S. 375, Becker (1981a), S. 42ff. und S. 46ff. und ders. (1981b).Google Scholar
  69. Vgl. Becker (1981a), S. 44ff.Google Scholar
  70. Vgl. Dickmann (1981), S. 71ff., Sticker/Kuon (1988), S. 579 und Becker (1981), S. 37ff.Google Scholar
  71. Vgl. Dickmann (1980), S. 80ff. und Becker (1981a), S. 37f.Google Scholar
  72. Vgl. Neuburger (1988), S. 569ff., Neuburger/Chossy (1986), S. 516ff. und McNown/Rogers (1992), S. 421ff.Google Scholar
  73. Vgl. Pilzweger (19884), S. 442ff.Google Scholar
  74. Vgl. Helten/Kürble (1982), S. 448ff. und Helten (198 lb), S. 343ff.Google Scholar
  75. Vgl. Helten/Kürble (1982), S. 451. Die Angaben für 1)-3) beziehen sich jeweils auf den Median der Schätzungen im Vergleich zur tatsächlichen Realisierung.Google Scholar
  76. Vgl. Bates/Granger (1969), S. 451 und S. 462f. und Clemen (1989), S. 559.Google Scholar
  77. Die stärkere Verbesserung resultierte dabei aus der Berücksichtigung des Korrelationskoeffizienten (0,6) der beiden Prognosefehler. Vgl. Bates/Granger (1969), S. 451f. und S. 456f. Bei der in Kap. 2.2.4. beschriebenen M-Competition wurde dieses Ergebnis bei der ungewichteten Kombination von sechs Einzelprognosen tendenziell bestätigt. Das Ergebnis übertraf sogar das der gewichteten Kombination derselben Einzelprognosen. Vgl. Makridakis et al. (1982), S. 127 und S. 139.Google Scholar
  78. Vgl. zum folgenden Bates/Granger (1969), S. 452f. und, auf die Kombination mehrerer Prognosen verallgemeinert, Newbold/Granger (1974), S. 135ff.Google Scholar
  79. Vgl. Newbold/Granger (1974), S. 139 und Hüttner (1994), S. 356.Google Scholar
  80. Vgl. Newbold/Granger (1974), S. 136 und Deutsch/Granger/Teräsvirta (1994), S. 47f.Google Scholar
  81. Vgl. Bates/Granger (1969), S. 453ff. und Armstrong (1990), S. 585f.Google Scholar
  82. Vgl. Bates/Granger (1969), S. 454f. Vgl. auch die beiden Ansätze der adaptiven Kriteriengewichtung bei Deutsch/Granger/Teräsvirta (1994), S. 48ff.Google Scholar
  83. Vgl. auch die hierzu konträren Ergebnisse der empirischen Tests bei Deutsch/Granger/Teräsvirta (1994), S. 53ff.Google Scholar
  84. Vgl. Armstrong (1990), S. 587 und Deutsch/Granger/Teräsvirta (1994), S. 48.Google Scholar
  85. Vgl. Dawes/Fildes/Lawrence/Ord (1994), S. 157 und Newbold/Granger (1974), S. 136f. Vgl. Deutsch/Granger/Teräsvirta (1994), S. 56.Google Scholar
  86. Vgl. Hüttner (1994), S. 356 und Dangerfield/Morris (1992), S. 235ff.Google Scholar
  87. Vgl. beispielsweise zur Bedeutung der Stationärität der Zeitreihe Miller/Clemen/Winkler (1991), S. 516ff.Google Scholar
  88. Vgl. Brockhoff (1977), S. 150.Google Scholar
  89. Wegen dieser Programmvielfalt wird die untemehmensindividuelle Prognosesoftwareentwicklung im weiteren nicht berücksichtigt. Durch eigene Entwicklungen können jedoch die bei der Integrierung eines gekauften oder geleasten Programms in das konkret vorhandene EDV-System vereinzelt auftretenden Schwierigkeiten, z.B. hinsichtlich der Datenkompatibilität, vermieden werden. Vgl. zur Gestaltung und Organisation eines Prognose-Methodenbanksystems Eckardt (1980), S. 115ff., Scheer (1983), S. 38ff. und Brockhoff(1977), S. 141ff.Google Scholar
  90. Weiterfiihrende, aktuelle und praxisnahe Informationen liefern auch die PrognosesoftwareÜbersichten, die in unregelmäßigen Abständen im I. veröffentlicht werden.Google Scholar
  91. Vgl. in diesem Zusammenhang auch Weber (1990a), S. 592ff.Google Scholar
  92. Vgl. Tashman/Leach (1991), S. 209 und Janetzke/Falk (1994), S. 317. Vgl. in diesem Zusammenhang auch die Kriterien zur Prognoseprogranunbeurteilung bei Weber (1991), S. 76f., Brockhoff (1977), S. 154ff., Eckardt (1980), S. 119ff., Scheer (1983), S. 40f. und Jarrett (1987), S. 115ff.Google Scholar
  93. Quelle: Tashman/Leach (1991), S. 213; das Kriterium “Vorläufige Datendekomposition” wurde nicht berücksichtigt.Google Scholar
  94. Vgl. zur folgenden Zusammenstellung der Ergebnisse Tashman/Leach (1991), S. 213ff.Google Scholar
  95. Vgl. Janetzke/Falk (1994), S. 317 und Brockhoff (1977), S. 149.Google Scholar
  96. Dieser, aus der Sicht der Softwarehersteller durchaus verständliche Sachverhalt wurde bereits bei Em-de (1980), S. 91 aufgezeigt.Google Scholar
  97. Zwar scheidet “learning by doing” in Anbetracht der Bedeutung von Schadenprognosen sowieso von vornherein aus, aber durch diese Eigenschaft der Prognoseprogramme sind sie auch nur eingeschränkt für Schulungszwecke einsetzbar.Google Scholar
  98. Vgl. Weber (1990a), S. 593.Google Scholar
  99. Vgl. Janetzke/Falk (1994), S. 317, Gorr (1994), S. 1f. und Hill/Marquez/O’Connor/Remus (1994), S. 5ff.Google Scholar
  100. Vgl. Gorr (1994), S. 2f., Janetzke/Falk (1994), S. 319 und Griese/Eckardt (1994), S. 90f. Allerdings läuft auch dieser Ansatz wieder auf die Problematik der Gewichtung der einzelnen Entscheidungskriterien hinaus, da es sich bei den implementierten Wahrscheinlichkeiten letztlich um subjektive Einschätzungen des Programmierers handelt. Die diesen subjektiven Wahrscheinlichkeiten zugrunde liegenden Untersuchungen und Vergleiche müssen aber fir die konkrete Prognoseproblematik nicht immer gleich relevant sein.Google Scholar
  101. Vgl. Janetzke/Falk (1994), S. 317. In diesem Bereich der Künstlichen Intelligenz (KI) wird auch an der Adaption der Möglichkeiten Künstlicher Neuronaler Netze (KNN) für Prognosezwecke gearbeitet. Vgl. Gorr (1994), Hill/Marquez/O’Connor/Remus (1994)und Griese/Eckardt ( 1994 ), S. 97.Google Scholar
  102. Vgl. Lewandowski (1974), S. 199f.Google Scholar

Copyright information

© Springer Fachmedien Wiesbaden 1998

Authors and Affiliations

  • Martin Busshart
  • Matthias F. F. Maneth
  • Roland Eisen

There are no affiliations available

Personalised recommendations