Skip to main content

Zwei Modelle zu positiven Grössen

  • Chapter
  • First Online:
Angewandte Datenanalyse

Part of the book series: Statistik und ihre Anwendungen ((STATIST))

  • 6856 Accesses

Zusammenfassung

In vielen Untersuchungen werden nicht negative, kontinuierliche Grössen, wie Wartezeiten vor Flugschaltern, Lebensdauern von Geräten, Zerfallszeiten von radioaktiven Elementen oder Schadensummen bei Unwettern, betrachtet. Ausserdem werden auch positive diskrete Grössen studiert, wie die Anzahl Unfälle während eines Jahres, wie die monatlichen Schadensfälle bei einer Versicherung, oder die Anzahl Zerfälle von α-Teilchen während einer Stunde oder die Anzahl Löcher in produzierten porösen Membranen. Wie Parameter von solchen Grössen berechnet werden können, wird in diesem Kapitel gezeigt. Die Resultate hängen dabei vom Datenmodell ab, das besagt, wie Messwerte der Grössen streuen. Es ist daher sinnvoll, das Datenmodell zu beurteilen. Wie dies gemacht werden kann, wird in diesem Kapitel ebenfalls diskutiert.

Diesmal war kein Schildchen daran mit der Anschrift ‚Trink mich‘, aber sie entkorkte es trotzdem und führte es an die Lippen. „Irgend etwas Interessantes passiert ja immer“, sagte sie sich, „sobald ich etwas esse oder trinke; ich will doch einmal sehen, wie diese Flasche hier wirkt. Hoffentlich lässt sie mich wieder grösser werden, denn langsam bin ich es wirklich leid, so winzig klein herumzulaufen!“

Lewis Carroll, Alice im Wunderland (Insel Taschenbuch, 1973, S. 37.)

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 29.99
Price excludes VAT (USA)
  • Available as EPUB and PDF
  • Read on any device
  • Instant download
  • Own it forever

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Notes

  1. 1.

    Für einen Beweis, siehe 3;

  2. 2.

    Dies darf hier durchaus kritisch hinterfragt werden.

  3. 3.

    Am einfachsten ist es, μ durch \(\mu=1/\lambda\) zu substituieren. Das Integral lässt sich anschliessend mit einem Taschenrechner oder von Hand mit partieller Integration bestimmen.

  4. 4.

    Was der Standardfehler ist, wird in Kap. 14 erklärt.

  5. 5.

    Die Wahrscheinlichkeit m i , dass im gesamten Zeitintervall i Ereignisse stattfinden, ist proportional zur Anzahl Möglichkeiten, i Einer und \(M-i\) Nullen in die M Boxen zu legen. Diese Anzahl berechnet sich mit einem Binomialkoeffizienten. Es gilt

    $$m_{i}\;\propto\;\binom{M}{i}=\frac{M!}{i!\cdot(M-i)!}\approx\frac{M^{i}}{i!}$$

    Der approximative Ausdruck rechts ist nur für grosse M gültig und wird hier verwendet. Die Summe aller m i muss 1 sein. Man erhält \(m_{i}\approx M^{i}/i!\cdot\exp(-M)\).

  6. 6.

    Für einen Beweis siehe  3;

  7. 7.

    \(k!\) ist das Produkt der ersten k natürlichen Zahlen: \(1!=1\), \(2!=1\cdot 2\), \(3!=1\cdot 2\cdot 3\). Für \(0!\) setzt man \(0!=1\).

  8. 8.

    Man nennt die Konstanten a und b, die im Prior sind, Hyperparameter.

Literatur

  1. H. Bühlmann, A. Gisler, A Course in Credibility Theory and its Applications (Springer-Verlag, Berlin, Heidelberg, New York, 2005)

    MATH  Google Scholar 

  2. F. Proschan, Theoretical explanation of observed decreasing failure rate. Technometrics 5, 373–383 (1963)

    Article  Google Scholar 

  3. D.S. Sivia, J. Skilling, Data Analysis, a Bayesian Tutorial (Oxford University Press, 2006)

    Google Scholar 

Download references

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to Daniel Bättig Prof. Dr. .

Reflexion

Reflexion

9.1

Sein Wissen zu einer nicht negativen, stetigen Grösse T beschreibt jemand mit einer Exponentialverteilung mit Rate \(\lambda=1/\mu=0{,}1\). Berechnen Sie mit einem Taschenrechner oder einem Statistikprogramm die folgenden Wahrscheinlichkeiten:

$$\mathbb{P}(3\leq T\leq 15\;|\;\mu),\quad\mathbb{P}(T<10\;|\;\mu),\quad\mathbb{P}(T\geq 7\;|\;\mu)$$

Erzeugen Sie mit einem Statistikprogramm 80 unabhängige Werte, die exponentialverteilt mit Rate 0,1 sind. Visualisieren Sie die Werte mit einem Histogramm.

9.2

Für die Passagierflugzeuge vom Typ Boeing 720 soll die durchschnittlich erwartbare Funktionsdauer μ der Klimaanlage berechnet werden. Zudem soll prognostiziert werden, wie lange eine Klimaanlage ohne Unterbruch funktioniert. Dazu werden die Funktionsdauern – eine kontinuierliche Grösse – von zwölf Klimaanlagen untersucht. Hier die Resultate (in Stunden) aus 2; :

$$3\quad 5\quad 7\quad 18\quad 43\quad 85\quad 91\quad 98\quad 100\quad 130\quad 230\quad 487$$

Machen Sie eine sinnvolle Annahme für ein stetiges Datenmodell \(\mathbb{P}(T\,|\,\mu)\) der Funktionsdauer T, um den gesuchten Parameter μ zu berechnen.

  1. (a)

    Zeichnen Sie den Graphen der A posteriori-Dichtefunktion der mittleren erwartbaren Funktionsdauer μ. Was ist der plausibelste Wert von μ? Beantworten Sie die folgenden Fragen: Wie lautet die Fünf-Zahlen-Zusammenfassung zu μ, wie ein 50 % und ein 95 % Wahrscheinlichkeitsintervall?

  2. (b)

    Wie gross ist die Wahrscheinlichkeit, dass zukünftig gemessene Funktionsdauern (1) kleiner als 50 Stunden, (2) zwischen 100 und 150 Stunden und (3) grösser als 500 Stunden betragen werden?

  3. (c)

    Beurteilen Sie, ob Ihr gewähltes Datenmodell sinnvoll ist. Zeichnen Sie dazu einen QQ-Plot.

9.3

Eine Firma interessiert sich, wie lange es geht, bis ihre produzierten, wiederaufladbaren Batterien bei voller Belastung entladen sind. Die Verantwortliche der Produktion möchte dazu die durchschnittliche Entladungszeit \(\overline{T}_{\text{Prod}}\) aller produzierten Batterien bestimmen. Weiter will sie auch prognostizieren, in welchem Bereich gemessene Entladungszeiten T liegen werden. Das Wissen zu Entladungszeiten soll dabei mit einem stetigen Wahrscheinlichkeitsmodell beschrieben werden. Machen Sie dazu eine sinnvolle Annahme für das Datenmodell \(\mathbb{P}(T\,|\,\overline{T}_{\text{Prod}})\) der Entladungszeit T.

  1. (a)

    Berechnen Sie den gesuchten Parameter \(\overline{T}_{\text{Prod}}\) aus drei gemessenen Entladungszeiten: 301,2, 378,7 und 315,0 Minuten. Zeichnen Sie dazu den Graphen der A posteriori-Dichtefunktion von \(\overline{T}_{\text{Prod}}\). Was ist der plausibelste Wert für die durchschnittliche Entladungszeit?

  2. (b)

    Wie lautet die Fünf-Zahlen-Zusammenfassung, wie ein 50 % und ein 95 % Wahrscheinlichkeitsintervall für \(\overline{T}_{\text{Prod}}\)?

  3. (c)

    Wie gross ist die Wahrscheinlichkeit, dass zukünftig gemessene Entladungszeiten (1) kleiner als 300 Minuten, (2) zwischen 60 und 120 Minuten und (3) grösser als 360 Minuten betragen werden?

  4. (d)

    Führen Sie die Aufgaben (a)–(c) nocheinmal durch, wenn nur eine Messung von \(310{,}5\) Minuten vorliegt.

  5. (e)

    Rechnen Sie die Aufgabe (d) noch einmal durch. Wählen Sie dabei als Prior für den Parameter \(\overline{T}_{\text{Prod}}\) die A posteriori-Verteilung aus der Aufgabe (a).

9.4

Beim Beispiel 3.20 von W. W. Scherkenbach aus der Motorenfabrik Ford werden bei Angestellten der Firma die Anzahl Fehler während eines Zeitfensters – wie Rechen- oder Zeichenfehler, Fehler beim Zusammenstellen von Produkten, etc. – gezählt. Gesucht wird dabei die – in Zukunft – erwartbare durchschnittliche Anzahl Fehler λ pro Zeitfenster und pro Person, sowie eine Prognose für zukünftige Beobachtungen diesbezüglich. Machen Sie eine sinnvolle Annahme für das diskrete Datenmodell \(\mathbb{P}(N\;|\;\lambda)\) der Anzahl Fehler N.

  1. (a)

    Berechnen Sie den Posterior von λ. Was ist der plausibelste Wert von λ?

  2. (b)

    Wie lautet die Fünf-Zahlen-Zusammenfassung zu λ, wie Wahrscheinlichkeitsintervalle zum Niveau 0,5, 0,68 und 0,95?

  3. (c)

    Berechnen Sie ein Wahrscheinlichkeitsintervall für λ zum Niveau von etwa 0,95 mit der im Kapitel vorgestellten Standardfehler-Formel.

  4. (d)

    Wie gross ist die Wahrscheinlichkeit, dass zukünftige Beobachtungen der Anzahl Fehler (1) grösser als 10, (2) grösser als 20 sind?

  5. (e)

    Beurteilen Sie, ob das Datenmodell – die Poissonverteilung – sinnvoll ist. Zeichnen Sie dazu den QQ-Plot mit Hilfe des Prognosemodells aus der Aufgabe (d).

  6. (f)

    Ist es gerecht, Charlie einen Bonus zu verweigern? Berechnen Sie dazu die Wahrscheinlichkeit aus dem Prognosemodell, dass \(N_{\text{zukunft}}\) grösser 22 ist.

9.5

Die Schweizerischen Bundesbahnen (SBB) erfassen im Rahmen ihres Qualitätsmanagements die Signalvorfälle. Hier die beobachteten Signalvorfälle in den Jahren 2008–2012 (Sonntagszeitung vom 13.1.2013):

Jahr

 

2008

2009

2010

2011

2012

Vorfälle

 

96

129

86

91

111

Gesucht ist (1) die zukünftige durchschnittliche Anzahl Signalvorfälle λ pro Jahr und (2) eine Prognose für die Anzahl Signalvorfälle N im Jahr 2013. Sie nehmen an, dass die Anzahl Signalvorfälle N mit einer Poisson-Verteilung modelliert werden. Sie haben weiter keine zusätzlichen Informationen zu λ.

  1. (a)

    Beurteilen Sie, ob die Beobachtungen unter statistischer Kontrolle sind.

  2. (b)

    Berechnen Sie den gesuchten Parameter λ. Was ist der plausibelste Wert von λ?

  3. (c)

    Bestimmen Sie die Fünf-Zahlen-Zusammenfassung zu λ, sowie ein 50 % und ein 95 % Wahrscheinlichkeitsintervall.

  4. (d)

    Wie lauten Wahrscheinlichkeitsintervalle für λ zum Niveau von etwa 0,5 und etwa 0,95, berechnet mit dem Standardfehler? Vergleichen Sie die Resultate mit denen von Aufgabe (c).

  5. (e)

    Wie gross sind die Wahrscheinlichkeiten, dass die Anzahl Signalvorfälle N im Jahr 2013 (1) zwischen 70 und 130, (2) kleiner als 110 und (3) grösser als 90 sind?

  6. (f)

    Ist es sinnvoll das Datenmodell, mit einem QQ-Plot zu „überprüfen“?

9.6

Eine Firma produziert Filtermembranen. Wegen variierender Produktionsbedingungen haben die Membranen verschiedene Porendichten. Ein Chemielabor möchte aus einer Stichprobe die durchschnittliche Porendichte \(\overline{P}_{\text{Prod}}\) der Filtermembranen der Gesamtproduktion berechnen und wissen, in welchem Bereich gezählte Porendichten liegen werden. Eine Person untersucht eine Membran und zählt 1020 Poren pro mm\({}^{2}\). Machen Sie eine sinnvolle Annahme für das Datenmodell \(\mathbb{P}(P\;|\;\overline{P}_{\text{Prod}})\) der Porendichte P. Das Datenmodell soll diskret sein.

  1. (a)

    Berechnen Sie die A posteriori-Verteilung des gesuchten Parameters \(\overline{P}_{\text{Prod}}\). Was ist der plausibelste Wert von \(\overline{P}_{\text{Prod}}\)?

  2. (b)

    Wie lautet die Fünf-Zahlen-Zusammenfassung für \(\overline{P}_{\text{Prod}}\), wie Wahrscheinlichkeitsintervalle zum Niveau 0,5 und 0,95?

  3. (c)

    Wie gross sind die Wahrscheinlichkeiten, dass zukünftige Messungen der Porendichte (1) grösser als 1030 pro mm\({}^{2}\), (2) zwischen 1000 und 1030 pro mm\({}^{2}\) sind?

  4. (d)

    Führen Sie die Aufgaben (a) und (b) noch einmal durch, diesmal unter der Voraussetzung, dass vier gemessene Porendichten 1020, 1044, 1012 und 1025 pro mm\({}^{2}\) vorliegen. Benutzen Sie dabei als Prior für den Parameter \(\overline{P}_{\text{Prod}}\) den Posterior aus Aufgabe (a).

9.7

Rechnen Sie das Beispiel 9.4 zu den Anzahl grosser Schäden noch einmal durch, diesmal mit dem Prior

$$\text{pdf}(\lambda\;|\;\text{Vorinformation})\;\propto\;\lambda^{4}\cdot\exp(-0{,}8\cdot\lambda)$$
  1. (a)

    Wie lauten Wahrscheinlichkeitsintervalle zum Niveau 0,5 und 0,95 für die zukünftige durchschnittliche Anzahl λ grosser Schadensummen pro Halbjahr? Nennen Sie den plausibelsten Wert von λ.

  2. (b)

    Wie gross ist die Wahrscheinlichkeit, dass die Anzahl \(N_{\text{zukunft}}\) grosser Schadensummen im nächsten Halbjahr grösser als 5 ist?

9.8

Gletscherstürze und Gletscherhochwasser stellen Gefahren für Siedlungen, Verkehrs- und Wanderwege dar. Bei 49 Gletschern in der Schweiz besteht laut einer Studie der ETH Zürich die Gefahr, dass in naher Zukunft solche Katastrophen zu Todesopfern führen können. Tabelle 9.3 zeigt Schadenereignisse mit Todesopfern aus dem Zeitabschnitt von 1595 bis 1992. Mit den Daten sollen die zukünftige durchschnittliche Anzahl Todesopfer bei Gletscherabbrüchen und Gletscherhochwassern berechnet werden.

  1. (a)

    Stellen Sie die Daten mit einem Streudiagramm dar. Beurteilen Sie: Sind die Daten unter statistischer Kontrolle? Können sie als unabhängig betrachtet werden?

  2. (b)

    Erklären Sie, warum es sinnvoll ist, die zukünftige Anzahl Todesopfer mit einer Poissonverteilung zu modellieren. Berechnen Sie den Parameter λ der Poissonverteilung. Was ist der plausibelste Wert von λ? Geben Sie Wahrscheinlichkeitsintervalle zum Niveau 0,5 und zum Niveau 0,95 für λ an.

  3. (c)

    Berechnen Sie ein Wahrscheinlichkeitsintervall für λ zum Niveau von etwa 0,95 mit der im Kapitel vorgestellten Standardfehler-Formel.

  4. (d)

    Wie gross ist die Wahrscheinlichkeit, dass bei einem zukünftigen Gletscherabbruch oder Gletscherhochwasser mehr als 50 Personen sterben? Was liefert das Modell für die Wahrscheinlichkeit, dass mehr als 150 Personen sterben könnten?

  5. (e)

    Beurteilen Sie, ob das Datenmodell in (b) sinnvoll ist. Zeichnen Sie dazu den QQ-Plot.

Tab. 9.3 Todesopfer wegen Gletscherabbrüchen und Gletscherhochwassern aus dem Zeitabschnitt von 1595 bis 1992

Rights and permissions

Reprints and permissions

Copyright information

© 2015 Springer-Verlag Berlin Heidelberg

About this chapter

Cite this chapter

Bättig, D. (2015). Zwei Modelle zu positiven Grössen. In: Angewandte Datenanalyse. Statistik und ihre Anwendungen. Springer Spektrum, Berlin, Heidelberg. https://doi.org/10.1007/978-3-662-43394-2_9

Download citation

Publish with us

Policies and ethics