Skip to main content

Standardfehler, Ranglisten und Modelle

  • Chapter
  • First Online:
Angewandte Datenanalyse

Part of the book series: Statistik und ihre Anwendungen ((STATIST))

  • 6933 Accesses

Zusammenfassung

Nicht direkt messbare Grössen werden oft aus verschiedenen Gruppen berechnet. So will man aus einer Stichprobe die durchschnittlichen Raten der Neuerkrankungen an Lungenkrebs in verschiedenen Regionen kennen. Eine Ingenieurin will die Haftkraft von Klebeetiketten (eine Grösse, die wegen Messunsicherheiten und variierender Kovariablen nicht direkt bestimmbar ist) aus drei Produktionsarten vergleichen. Um solche Vergleiche anzustellen, kann man die Laplace-Approximation und den Standardfehler benutzen. Was dies ist und worauf man hierbei achten sollte, wird in diesem Kapitel beschrieben.

Nicht nur Gruppen, sondern auch verschiedene Regressionsmodelle können miteinander verglichen werden. Beispielsweise: „Welches Modell ist plausibler, um eine Zielgrösse in Funktion von erklärenden Variablen zu berechnen? Modell A oder Modell B?“ Am Schluss des Kapitels findet man dazu eine Einführung.

Nachdem sie indessen ungefähr eine halbe Stunde lang gelaufen und wieder ganz trocken geworden waren, rief der Brachvogel plötzlich: „Ende des Wettlaufs!“, und alle drängten sich, noch ganz ausser Atem, um ihn und fragten: „Aber wer ist Sieger?“

Dies konnte der Brachvogel nicht ohne tieferes Nachdenken beantworten, und so sass er längere Zeit hindurch da und legte den Zeigefinger an die Stirn (eine Haltung, in der ihr gewöhnlich Goethe auf den Titelbildern sitzen seht), während ringsum alles schwieg und wartete. Endlich sagte der Brachvogel: „Alle sind Sieger, und jeder muss einen Preis bekommen.“

Lewis Carroll, Alice im Wunderland (Insel Taschenbuch, 1973, S. 30)

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 29.99
Price excludes VAT (USA)
  • Available as EPUB and PDF
  • Read on any device
  • Instant download
  • Own it forever

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Notes

  1. 1.

    Man zeigt das Folgende:

    1. (1)

      Der Modus der A posteriori-Verteilung ist konsistent. Dies bedeutet: er schätzt die nicht direkt messbare Grösse immer besser, wenn die Anzahl Messungen zunimmt.

    2. (2)

      Die A posteriori-Verteilung konzentriert sich bei unabhängigen Messungen immer stärker um den Modus, wenn die A priori-Verteilung vernünftig gewählt ist.

    3. (3)

      Die Methode von Laplace approximiert die A posteriori-Verteilung gut, wenn der Modus nicht am Rand der Verteilung liegt.

    Die Details dazu – und interessante Gegenbeispiele – findet man in 3; in Anhang B.

  2. 2.

    Ist das Datenmodell die Exponentialverteilung mit Parameter μ, so lautet die A posteriori-Verteilung des Parameters

    $$\text{pdf}(\mu\;|\;\text{Daten, Vorinformation})\> \propto\;{\mu^{-n}}\cdot\exp(-n\cdot\overline{x}/\mu)\cdot\text{pdf}(\mu\;|\;\text{Vorinformation})$$

    Dabei ist \(\overline{x}\) das arithmetische Mittel der Daten und n ist die Anzahl Messungen. Ist die Likelihood dominant, so ist der Modus \(\mu_{0}\) der Verteilung \(\overline{x}\). Die beobachtete Information lautet

    $$I(\mu)=-\frac{n}{\mu^{2}}+2\cdot\frac{n\cdot\overline{x}}{\mu^{3}}$$

    Setzt man hier den Modus \(\mu_{0}\) ein, erhält man \(I(\mu_{0})={n}/{\overline{x}^{2}}\). Deshalb ist der Standardfehler \(\text{SE}(\text{exp})={\overline{x}}/{\sqrt{n}}\). Dies ergibt die Formel (9.1).

  3. 3.

    Ein Beispiel, bei der die δ-Methode schlecht ist, findet man in 9; auf den Seiten 74–77.

  4. 4.

    Man findet ähnliche und andere Rechnungen in den meisten Büchern, die sich mit Wahrscheinlichkeitsmodellen befassen. Präziser kann man sogar sagen: Sind zwei Grössen X und Y normalverteilt, so sind auch die Summe \(S=X+Y\) und die Differenz \(D=X-Y\) normalverteilt. Die Moden sind \(X_{0}+Y_{0}\) und \(X_{0}-Y_{0}\). Die Varianz \((\delta S)^{2}\) von S und D ist, falls X und Y unabhängig sind, gleich \((\delta X)^{2}+(\delta Y)^{2}\). Um dies zu zeigen, braucht man die gemeinsame Verteilung \(\text{pdf}(X,Y)\) von X und Y. Sind X und Y unabhängig, so ist nach der Multiplikationsregel

    $$\text{pdf}(X,Y)=\text{pdf}(X)\cdot\text{pdf}(Y)\propto\exp\left\{-0{,}5\cdot\chi^{2}\right\}$$

    mit

    $$\chi^{2}=\left(\frac{X-X_{0}}{\delta X}\right)^{2}+\left(\frac{Y-Y_{0}}{\delta Y}\right)^{2}$$

    Die Wahrscheinlichkeit, dass \(S=S_{0}\pm\delta S\) ist, ist gleich dem Volumen unter der Fläche des Graphen der Dichtefunktion \(\text{pdf}(X,Y)\), beschränkt durch \(X+Y=S_{0}\pm\delta S\). Man erhält ein Integral, das sich mit der Substitution \(S=X+Y\), \(T=Y\) und algebraischen Tricks durch die Dichte der Normalverteilung ausdrücken lässt.

  5. 5.

    Man nennt den durchschnittlichen Wert von \(\Delta X\cdot\Delta Y\) auch die Kovarianz (engl. Covariance) der gemeinsamen Verteilung von X und Y. Man hat allgemein für \(S=X+Y\):

    $$(\delta S)^{2}=(\delta X)^{2}+(\delta Y)^{2}+2\cdot\text{Cov}(X,Y)$$
  6. 6.

    Ist \(P=X\cdot Y\), so erhält man aus \(\ln P=\ln X+\ln Y\) die erwähnte Formel. Nach der Transformationsformel ist \(\ln X\approx\ln X_{0}\pm\delta X/X_{0}\). Somit folgt

    $$\delta\ln P\approx\sqrt{\left(\frac{\delta X}{X_{0}}\right)^{2}+\left(\frac{\delta Y}{Y_{0}}\right)^{2}}$$
  7. 7.

    Wenn keine Studien aus früheren Jahren vorliegen, kann man als Prior die Daten aus der Gesamtregion Bayern und als Likelihood die Teildaten aus der Region X benutzen. Der Datensatz wird so zweimal verwendet. Man spricht hier von der empirischen Bayes-Methode. Ein moderneres (und besseres) Verfahren ist, mit einem hierarchischen Modell zu arbeiten.

  8. 8.

    In der frequentistischen Statistik spricht man von der Varianz-Analyse (engl. analysis of variance [ANOVA]). Man berechnet einen p-Wert, der zum Teil mit der inversen Wahrscheinlichkeit der Plausibilität \(\mathbb{P}({\cal M}\,|\text{ Daten})\) verknüpft ist.

  9. 9.

    Der folgende Text folgt den Erläuterungen von 9; auf den Seiten 78–83. Eine detaillierte Rechnung mit Angaben zu Originalartikeln von Tierney und Kadane, sowie von Jeffreys findet man in 7; .

  10. 10.

    Die Dichtefunktion der Normalverteilung ist

    $$\text{pdf}(x\;|\;\mu,\sigma)=\frac{1}{\sqrt{2\pi\sigma^{2}}}\exp\left\{-0{,}5\cdot\left(\frac{x-\mu}{\sigma}\right)^{2}\right\}$$

    Weil \(\int_{-\infty}^{\infty}\text{pdf}(x\;|\;\mu,\sigma)\,\mathrm{d}x=1\) ist, folgt \(\int_{-\infty}^{\infty}\sqrt{2\pi\sigma^{2}}\cdot\text{pdf}(x\;|\;\mu,\sigma)\,\mathrm{d}x=\sqrt{2\pi}\sigma\).

  11. 11.

    Es ist \(\mathbb{P}({\cal M}_{\text{Jahr}})+\mathbb{P}({\cal M}_{\text{Jahr, Mond}})=1\) und \(\mathbb{P}({\cal M}_{\text{Jahr}})\approx 13{,}30\cdot\mathbb{P}({\cal M}_{\text{Jahr, Mond}})\).

  12. 12.

    Beliebt ist es, das Model \({\cal M}_{\text{Veg}}\) anders zu schreiben: \(\mu(i)=\alpha+\beta_{1}\cdot X_{1}+\beta_{2}\cdot X_{2}+\beta_{3}\cdot X_{3}\) mit \(\beta_{1}+\beta_{2}+\beta_{3}=0\). Mit dieser Schreibeweise messen die \(\beta_{i}\) die Abweichungen des Lageparameters der Gruppe i vom Gesamtmittel α. Das Modell hat drei Parameter, da die Summe der β’s eins ist.

Literatur

  1. C. Daniel, Applications of Statistics to Industrial Experimentation (John Wiley & Sons, New York, 1976)

    Book  MATH  Google Scholar 

  2. D. Freedman, R. Pisani, R. Purves, Statistics, 4. Aufl. (W.W. Norton & Company, 2007)

    Google Scholar 

  3. A. Gelman, J.B. Carlin, H.S. Stern, D.B. Rubin, Bayesian Data Analysis (Chapman & Hall, 2004)

    Google Scholar 

  4. K. Graf, Skript Verfahrenstechnik (Berner Fachhochschule, 2008)

    Google Scholar 

  5. H. Hotelling, Some problems in weighing and other experimental techniques. Am. Math. Stat. 15, 297–306 (1944)

    Article  MATH  MathSciNet  Google Scholar 

  6. F. Oser, H. Biedermann, M. Kopp, S. Steinmann, C. Brühwiler, S. Krattenmacher, TEDS-M: Erste Ergebnisse für die Lehrerausbildung in der Deutschschweiz, Medienmitteilung, 15.4.2010

    Google Scholar 

  7. A.E. Raftery, Bayesian Model Selection in Social Research. Sociological Methodology 25, 111–163 (1995)

    Article  Google Scholar 

  8. G. Schwarz, Estimating the dimension of a model. The Annals of Statistics 6(2), 461–464 (1978)

    Article  MATH  MathSciNet  Google Scholar 

  9. D.S. Sivia, J. Skilling, Data Analysis, a Bayesian Tutorial, 2. Aufl. (Oxford Science Publications, ition, 2010)

    Google Scholar 

  10. H. Wainer, Picturing the Uncertain World, How to Understand, Communicate, and Control Uncertainty through Graphical Display (Princeton University Press, 2009)

    Google Scholar 

Download references

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to Daniel Bättig Prof. Dr. .

Reflexion

Reflexion

14.1

Bei gegebener Information \(\cal K\) macht eine Person Aussagen zu einer nicht direkt messbaren Grösse m, die zwischen 10 und 20 liegt, mit einem Wahrscheinlichkeitsmodell:

$$\text{pdf}(m\;|\;{\cal K})\;\propto\;(m-10)^{3}\cdot(20-m)^{4}$$
  1. (a)

    Zeichnen Sie den Graphen der Dichtefunktion. Wie ist das Modell verteilt? Wie lautet der Modus?

  2. (b)

    Bestimmen Sie die Wahrscheinlichkeit, dass m zwischen 15 und 16 liegt. Wie gross ist die Wahrscheinlichkeit, dass m grösser als \(12{,}5\) ist? Wie lautet die Wahrscheinlichkeit, dass m zwischen 12 und 15 liegt?

  3. (c)

    Wie lautet die beobachtete Information des Wahrscheinlichkeitsmodells?

  4. (d)

    Approximieren Sie das Modell mit einer Normalverteilung. Beurteilen Sie anhand der Graphen der beiden Dichtefunktionen, ob die Approximation gut ist. Wie lautet der Standardfehler SE von m? Bestimmen Sie daraus Wahrscheinlichkeitsintervalle für m zum Niveau von etwa 0,68 und etwa 0,95.

14.2

Die Plausibilität zu einem Parameter K > 0 beschreibt eine Person mit einem Wahrscheinlichkeitsmodell mit Dichtefunktion

$$\text{pdf}(K\;|\;\text{Daten})=\frac{1}{(K+1)^{2}}\quad\text{ f{\"u}r }K\geq 0$$
  1. (a)

    Zeichnen Sie den Graphen der Dichtefunktion.

  2. (b)

    Berechnen Sie die beobachtete Information des Modells.

  3. (c)

    Ist es sinnvoll, das Modell mit einer Normalverteilung zu approximieren?

14.3

Abbildung 14.15 zeigt den Graphen der A posteriori-Dichtefunktion, um die Plausibilität zu einer Grösse h zu beschreiben.

  1. (a)

    Wie ist das Modell verteilt? Wie lautet der Modus? Wo ungefähr liegt der Median?

  2. (b)

    Zeichnen Sie in die Graphik die Dichtefunktion der approximierenden Normalverteilung ein. Wie gross ist der Standardfehler von h ungefähr? Kreuzen Sie die richtige Antwort an:

    $$\square~{}~{}\text{SE}\approx 0{,}3\qquad\square~{}~{}\text{SE}\approx 1{,}8\qquad\square~{}~{}\text{SE}\approx 3{,}5\qquad\square~{}~{}\text{SE}\approx 10{,}4$$
  3. (c)

    Bestimmen Sie eine Präzisionsangabe von h in der Form \(h\pm\text{SE}\).

Abb. 14.15
figure 15

Graph der A posteriori-Dichtefunktion, um die Plausibilität zu h zu beschreiben

14.4

Eine Person formuliert mit der Laplace-Approximation die Plausibilität zu einer Grösse α:

$$\alpha=\alpha_{0}\pm\text{SE}(\alpha)=15{,}6\pm 1{,}4$$

Berechnen Sie mit einem Statistikprogramm die Wahrscheinlichkeiten \(\mathbb{P}(\alpha\leq 17{,}5)\), \(\mathbb{P}(\alpha<16{,}0)\), \(\mathbb{P}(\alpha> 14{,}1)\), \(\mathbb{P}(\alpha> 10)\) und \(\mathbb{P}(15{,}0<\alpha\leq 16{,}0)\).

14.5

Von einer Grösse m hat man die Präzisionsangabe mit dem Standardfehler:

$$m=m_{0}\pm\text{SE}(m)=m_{0}\pm\delta m=60{,}1\pm 3{,}2$$

Bestimmen Sie Präzisionsangaben mit dem Standardfehler für die Grössen m 2, \(4m^{2}\), \(1/m\), \(\ln m\) und \(m/(1+m)\).

14.6

Eine Ingenieurin hat mit der Laplace-Approximation die Plausibilität zweier Grössen A und B bestimmt:

$$A=A_{0}\pm\delta A=10{,}0\pm 0{,}2\qquad B=B_{0}\pm\delta B=2{,}0\pm 0{,}1$$
  1. (a)

    Wie lauten Präzisionsangaben für die Grössen A 3 und \(1/A\)?

  2. (b)

    Bestimmen Sie Wahrscheinlichkeitsintervalle zum Niveau von etwa 0,68 und etwa 0,95 der Grössen \(A+B\), \(A\cdot B\), \(A-B\) und \(B/A\). Nehmen Sie dazu an, dass A und B unabhängig sind.

14.7

Eine Person misst in unabhängiger Art die Dimensionen L, B und H einer rechteckigen Schachtel. Sie erhält:

$$\begin{aligned}L&=L_{0}\pm\delta L=(154{,}2\pm 0{,}5)\,\text{mm}\\ B&=B_{0}\pm\delta H=(82{,}3\pm 0{,}5)\,\text{mm}\\ H&=H_{0}\pm\delta B=(70{,}4\pm 0{,}5)\,\text{mm}\end{aligned}$$

Bestimmen Sie Wahrscheinlichkeitsintervalle zum Niveau von etwa 0,68 und 0,95 für das Volumen und die Oberfläche der Schachtel.

14.8

Die Plausibilität zu drei Grössen a, b und c wird mit dem Standardfehler angegeben:

$$a=a_{0}\pm\delta a=5{,}0\pm 0{,}4\qquad b=7{,}0\pm 0{,}3\qquad c=15{,}5\pm 0{,}2$$

Die A posteriori-Verteilungen der drei Grössen sind unabhängig.

  1. (a)

    Bestimmen Sie Wahrscheinlichkeitsintervalle zum Niveau von etwa 0,95 für die Grössen a, b und c.

  2. (b)

    Berechnen Sie Wahrscheinlichkeitsintervalle zum Niveau von etwa 0,68 der Grössen \(a+b^{2}\), \(a+b+c\) und von \(a-b+a\cdot c^{2}\).

14.9

Ein Zitat aus der Zeitung 20 Minuten vom 10.2.2011: Ausgesprochen freundlich, mit Fantasie gesegnet und ein schneller Denker soll er sein, der Wassermann. Glaubt man einer Auswertung der Versicherungsgesellschaft Allianz Suisse, sind Wassermänner auch die besten Autofahrer der Schweiz. Sowohl bei Haftpflichtfällen als auch bei Vollkaskoschäden hatten die Wassermänner 2010 eine um durchschnittlich 3,5 % niedrigere Schadensfrequenz als der Durchschnitt. Das Zitat bezieht sich auf eine Studie mit einem Stichprobenumfang von 40 000 Personen mit den Resultaten in Tab. 14.3.

Tab. 14.3 Sternzeichen und Schadensfrequenz (mit Standardfehler) (aus 20 Minuten, 10.2.2011)
  1. (a)

    Bestimmen Sie die Wahrscheinlichkeit, dass die Schadensfrequenz beim Sternzeichen Wassermann kleiner ist als beim Sternzeichen Steinbock.

  2. (b)

    Berechnen Sie mit einer Monte-Carlo-Simulation die Wahrscheinlichkeit, dass die Schadensfrequenz beim Sternzeichen Wassermann kleiner ist als bei den Sternzeichen Steinbock und Jungfrau.

  3. (c)

    Teilen Sie die Sternzeichen nach statistischen Kriterien in drei Gruppen ein: solche mit tiefer, mittlerer und hoher Schadensfrequenz.

14.10

In einer Fabrik interessiert man sich für die täglichen Durchschnittsmassen von gefüllten Flaschen. Um die Plausibilität zu diesen Durchschnittsmassen zu bestimmen, werden pro Tag zehn Flaschen gewogen. Tabelle 14.4 zeigt die plausibelsten Werte der Durchschnittsmassen (mit ihren Standardfehlern) aus dreizehn Produktionstagen.

Tab. 14.4 Durchnittsmassen aus 13 Losen mit Angabe des Standardfehlers

Ist die Produktion unter statistischer Kontrolle? Zeichnen Sie dazu eine Kontrollkarte mit oberen und unteren Kontrollgrenzen.

14.11

Von zwei Regressionsmodellen mit je einem Parameter kennt man das Folgende:

$$\begin{matrix}{}\text{ Modell }&\text{ Maximaler Wert Likelihood }&\text{ rel. Gewinn Pr{\"a}zision }\\ \hline{\cal M}_{1}&3{,}45\cdot 10^{4}&80\,\%\\ {\cal M}_{2}&4{,}35\cdot 10^{6}&99{,}9\,\%\end{matrix}$$

Der relative Gewinn der Präzision, sagt, um wie viel ein Parameter eines Modells dank Daten genauer bestimmt ist als vor der Datensammlung. So ist also beim Modell 1 mit Parameter a

$$\text{SE}(a)/(a_{\max}-a_{\min})=0{,}2$$
  1. (a)

    Welches Modell passt besser zu den Daten?

  2. (b)

    Welches Modell ist plausibler?

  3. (c)

    Wie lauten die A posteriori-Wahrscheinlichkeiten der beiden Modelle, wenn vor der Datensammlung beide Modelle gleich plausibel sind?

Rights and permissions

Reprints and permissions

Copyright information

© 2015 Springer-Verlag Berlin Heidelberg

About this chapter

Cite this chapter

Bättig, D. (2015). Standardfehler, Ranglisten und Modelle. In: Angewandte Datenanalyse. Statistik und ihre Anwendungen. Springer Spektrum, Berlin, Heidelberg. https://doi.org/10.1007/978-3-662-43394-2_14

Download citation

Publish with us

Policies and ethics