Skip to main content

Streuung und Normalverteilung

  • Chapter
  • First Online:
Angewandte Datenanalyse

Part of the book series: Statistik und ihre Anwendungen ((STATIST))

  • 6981 Accesses

Zusammenfassung

In der Produktionstechnik und in technischen Wissenschaften wird oft angenommen, dass mit einer Normalverteilung beschrieben werden kann, wie Messwerte streuen. Die Normalverteilung wird in diesem Kapitel vorgestellt. Zudem wird illustriert, warum es sinnvoll ist, diese Verteilung zu benutzen: Sie hat, gegeben der Erwartungswert und die Standardabweichung, eine maximale Entropie. Die Normalverteilung hat zwei Parameter: den Modus und die Standardabweichung. In vielen Anwendungen interessiert allerdings nur der Modus. Die Standardabweichung ist dann ein Störparameter} (engl. nuisance parameter), der mit dem Gesetz der Marginalisierung eliminiert werden kann.

Hinab, hinab, hinab. Wollte das denn nie ein Ende nehmen? „Wie viele Meilen ich wohl schon gefallen bin?“ sagte sie laut. „Weit kann es nicht mehr sein bis zum Erdmittelpunkt. Das wären dann, ja: sechstausend Kilometer wären das, ungefähr wenigstens –“ (denn wohlgemerkt, Alice hatte mancherlei Dinge dieser Art in der Schule lernen müssen, und wenn dies auch keine sehr gute Gelegenheit war, ihr Wissen anzubringen, weil ihr nämlich keiner zuhörte, so war es doch eine gute Übung) „– ja, das dürfte wohl die richtige Entfernung sein – aber dann möchte ich doch gerne wissen, welchen Längengrad ich wohl inzwischen habe und welchen Breitengrad?“

Lewis Carroll, Alice im Wunderland (Insel Taschenbuch, 1973, S. 13.)

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 29.99
Price excludes VAT (USA)
  • Available as EPUB and PDF
  • Read on any device
  • Instant download
  • Own it forever

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Notes

  1. 1.

    Der Begriff ‚Unsicherheit‘ darf hier nicht mit dem umgangssprachlichen Wort ‚Unsicherheit‘ verwechselt werden. Er bezeichnet hier die Standardabweichung.

  2. 2.

    GUM: Guide to the Expression of Uncertainty in Measurement, 1993 Geneva, Switzerland. Herausgegeben von ISO.

  3. 3.

    Die Shannon-Entropie der Normalverteilung lautet \(0{,}5+0{,}5\cdot\ln(2\pi)+\ln\sigma\). Je grösser die Streuung σ der Normalverteilung, um so grösser ist auch die Shannon-Entropie.

  4. 4.

    Zumindest, wenn der Prozess unter statistischer Kontrolle ist.

  5. 5.

    Zum Beispiel die Verteilung der Chloridionen oder Temperaturschwankungen in der Lösung

  6. 6.

    Im Gegensatz zur Normalverteilung strebt der Posterior für Cl nicht exponentiell schnell gegen Null. Man hat bei den sieben Messungen \(\text{pdf}(\text{Cl}\;|\;\text{Daten})\propto\text{Cl}^{-7}\), wenn Cl gross ist. Damit sind auch entfernte Werte vom Modus viel plausibler als beim Modell der Normalverteilung. Siehe dazu den Anhang .1.

  7. 7.

    Man benutzt das Verfahren von Laplace, dass in Kap. 14 vorgestellt wird.

  8. 8.

    KTI-Nr. 9029.1 PFIWI-IW, Berner Fachhochschule, 2007.

Literatur

  1. M.J. Harry, The Nature of Six Sigma Quality (Motorola Inc., Governement Electronics Group, 1988)

    Google Scholar 

  2. T. Pyzdek, The Complete Guide to the CQE (Quality Publishing Inc., Tucson, 1996)

    Google Scholar 

  3. J.A. Rice, Mathematical Statistics and Data Analysis (Duxburry Press, 1995)

    Google Scholar 

  4. R. Schor, Bohren von Lithium Niobat mit ps-Pulsen, Diplomarbeit Maschinentechnik, Berner Fachhochschule, Burgdorf (2006)

    Google Scholar 

Download references

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to Daniel Bättig Prof. Dr. .

Reflexion

Reflexion

10.1

Die Plausibilität zu einer stetigen Grösse K beschreibt jemand mit einer Normalverteilung. Der Modus der Verteilung ist \(\mu=\) 10,0 und die Standardabweichung σ beträgt 3,4.

  1. (a)

    Zeichnen Sie den Graphen der Dichtefunktion mit einem Statistikprogramm.

  2. (b)

    Berechnen Sie mit einem Taschenrechner oder einem Statistikprogramm die folgenden Wahrscheinlichkeiten:

    $$\mathbb{P}(7{,}1\leq K\leq 11{,}2\;|\;\mu,\sigma),\quad\mathbb{P}(K<14{,}3\;|\;\mu,\sigma),\quad\mathbb{P}(T\geq 9{,}3\;|\;\mu,\sigma)$$
  3. (c)

    Bestimmen Sie mit einem Statistikprogramm das 0,7- und das 0,96-Quantil des Wahrscheinlichkeitsmodells.

  4. (d)

    Erzeugen Sie mit einem Statistikprogramm 40 unabhängige Werte, die normalverteilt mit Modus 10,0 und Standardabweichung 3,4 sind. Visualisieren Sie die Werte mit einem Histogramm.

  5. (e)

    Bestimmen Sie von Hand ein 0,68-, ein 0,955- und ein 0,997-Wahrscheinlichkeitsintervall für die Grösse K.

10.2

Für einen Produktionsprozess gelte \(C_{\mathit{pk}}=0{,}7\). Wie weit ist der Schwerpunkt der Produktionsgrösse mindestens von den Spezifikationsgrenzen entfernt?

10.3

Für einen Produktionsprozess, der mit einer Normalverteilung modelliert ist, gelte \(C_{\mathit{pkl}}=0{,}8\) und \(C_{\mathit{pku}}=0{,}5\).

  1. (a)

    Visualisieren Sie die Situation mit einer Grafik.

  2. (b)

    Wie gross ist die (durchschnittlich erwartbare) Anzahl ppm pro eine Million produzierter Ware, welche nicht innerhalb der Spezifikationsgrenzen liegt?

10.4

Eine Person möchte ihr Gewicht G bestimmen. Sie steht dazu viermal auf eine Personenwaage und liest folgende Zahlen ab:

$$75{,}5\text{ kg}\quad 74{,}8\text{ kg}\quad 75{,}2\text{ kg}\quad 75{,}7\text{ kg}$$

Die Person weiss, dass ihr Gewicht zwischen 70 und 80 Kilo liegt. Weiter geht sie davon aus, dass die Messwerte, gegeben G, normalverteilt um G streuen. Weitere Informationen hat die Person nicht.

  1. (a)

    Überprüfen Sie, ob die Messwerte unter statistischer Kontrolle und unabhängig modellierbar sind.

  2. (b)

    Wie lautet der Ausdruck \(\chi^{2}\)? Bestimmen Sie die gemeinsame A posteriori-Verteilung der Parameter des Modells: den Modus G und die Standardabweichung σ.

  3. (c)

    Die Plausibilität zu G aus den Messungen kann mit dem Posterior von G beschrieben werden. Bestimmen Sie diese Verteilung und zeichnen Sie ihren Graphen. Berechnen Sie Wahrscheinlichkeitsintervalle zum Niveau 0,5 und 0,95 für das Gewicht G. Was ist der plausibelste Wert für das Gewicht der Person? (Arbeiten Sie dazu mit einer MCMC-Simulation oder mit Hilfe der Formeln zur t-Verteilung in Anhang .1.)

  4. (d)

    Bestimmen Sie ein Wahrscheinlichkeitsintervall zum Niveau von etwa 0,95 für das Gewicht G mit der Gleichung von de Moivre.

  5. (e)

    Die Person will weitere Messungen mit der Waage machen. In welchem Bereich werden diese Messwerte (1) mit einer Wahrscheinlichkeit von 0,5 und (2) mit einer Wahrscheinlichkeit von 0,95 liegen? (Arbeiten Sie dazu mit einer Monte-Carlo-Simulation oder mit Hilfe der Formeln zur t-Verteilung in Anhang .1.)

10.5

Eine Person möchte den Umfang d eines Balls berechnen. Sie misst dazu zweimal den Umfang und erhält 80,3 cm und 77,8 cm. Sie geht davon aus, dass mit diesem Band abgelesene Messwerte normalverteilt um den Umfang d streuen. Vor den Messungen hat die Person minimale Vorinformation zu d: \(70\text{ cm}\leq d\leq 90\) cm.

  1. (a)

    Wie lautet der Ausdruck \(\chi^{2}\)? Bestimmen Sie die gemeinsame A posteriori-Verteilung für die Parameter des Modells: den Umfang d und die Standardabweichung σ.

  2. (b)

    Die Plausibilität zu d aus den Messungen kann mit ihrer A posteriori-Verteilung beschrieben werden. Zeichnen Sie den Graphen dieser Verteilung (entweder aus einer MCMC-Simulation oder mit Hilfe der t-Verteilung aus Anhang .1).

  3. (c)

    Was ist der plausibelste Wert d 0 für den Umfang d? Bestimmen Sie Wahrscheinlichkeitsintervalle zum Niveau 0,5 und 0,95 für d.

  4. (d)

    Jemand will weitere Messungen des Umfangs durchführen. In welchem Bereich werden diese Messwerte mit einer Wahrscheinlichkeit von 0,5, bzw. einer Wahrscheinlichkeit von 0,95 liegen?

10.6

Die Firma Tillamook-Cheese in Oregon (USA) produziert Käselaibe mit einer mittleren Masse von etwa 19 kg. Zur Qualitätskontrolle müssen neben der Zusammensetzung der Laibe auch die mittlere Masse und die Streuung der Tagesproduktion bestimmt werden. Als Annahme gilt: die Messwerte streuen normalverteilt um die mittlere Masse der Produktion. Tabelle 1.13 in Kap. 1 zeigt 20 Massen. Weitere Information ist nicht vorhanden.

  1. (a)

    Überprüfen Sie, ob die Stichprobenwerte unter statistischer Kontrolle sind. Zeichnen Sie dazu ein Streudiagramm mit geschätzten Kontrollgrenzen. Plotten Sie auch den Graphen der Autokorrelationsfunktion um zu testen, ob die Messwerte als trendfrei und unabhängig betrachtet werden können.

  2. (b)

    Bestimmen Sie die Plausibilität zur mittleren Masse \(\overline{m}_{\text{Tag}}\) der Tagesproduktion. Zeichnen Sie dazu den Graphen der A posteriori-Dichtefunktion. Nennen Sie den Modus und Wahrscheinlichkeitsintervalle zum Niveau 0,5 und 0,95 für \(\overline{m}_{\text{Tag}}\).

  3. (c)

    Wie lautet die A posteriori-Dichtefunktion für die Streuung σ der Normalverteilung? Zeichnen Sie den Graphen dieser Verteilung. Was ist der „wahrscheinlichste“ Wert für σ? Berechnen Sie Wahrscheinlichkeitsintervalle zum Niveau 0,5 und 0,95 für σ.

  4. (d)

    Berechnen Sie approximative Wahrscheinlichkeitsintervalle für \(\overline{m}_{\text{Tag}}\) und σ zum Niveau 0,95 mit den Gleichungen (10.2) und (10.3).

  5. (e)

    In welchem Bereich werden weitere gemessene Massen mit einer Wahrscheinlichkeit von 0,5 bzw. von 0,95 liegen?

  6. (f)

    Überprüfen Sie das Datenmodell. Benutzen Sie dazu das Prognosemodell für zukünftige Messwerte und einen QQ-Plot. Ist das Modell sinnvoll?

  7. (g)

    Die Spezifikation für die produzierten Massen lautet: USL \(=41{,}6\) und OSL \(=42{,}8\). Wie gross ist die Wahrscheinlichkeit, dass \(C_{p}> 1\) ist? (Tipp: Was bedeutet \(C_{p}> 1\) für die Streuung σ? Benutzen Sie dann (c).)

10.7

Um die Durchschnittsmasse \(\overline{m}_{\text{Becken}}\) von 150 Fischen in einem Aufzuchtbecken zu berechnen, wurden zehn Fische durch Ziehen ohne Zurücklegen gewogen. Die Massen in Gramm sind:

$$898\quad 1198\quad 1294\quad 1516\quad 1196\quad 2050\quad 644\quad 1450\quad 1452\quad 1200$$

Angenommen wird, dass die Messwerte um die Durchschnittsmasse streuen und mit einem Modell mit endlicher Standardabweichung beschrieben werden können.Footnote 8

  1. (a)

    Kontrollieren Sie, ob die Messwerte unter statistischer Kontrolle sind.

  2. (b)

    Bestimmen Sie die A posteriori-Verteilung der Durchschnittsmasse der 150 Fische. Zeichnen Sie den Graphen der Dichtefunktion von \(\overline{m}_{\text{Becken}}\). Wie lautet der Modus m 0 dieser Verteilung? Bestimmen Sie Wahrscheinlichkeitsintervalle zum Niveau 0,5 und 0,95 für die Durchschnittsmasse der 150 Fische.

  3. (c)

    Zeichnen Sie den Graphen der A posteriori-Dichtefunktion für die Standardabweichung σ. Was ist der „wahrscheinlichste“ Wert für σ? Berechnen Sie Wahrscheinlichkeitsintervalle zum Niveau 0,5 und 0,95 für σ.

  4. (d)

    Eine Person zieht zufällig einen weiteren Fisch aus dem Becken. In welchem Bereich wird die dabei gemessene Fischmasse mit einer Wahrscheinlichkeit von 0,9 liegen? Wie gross ist die Wahrscheinlichkeit, dass die gemessene Fischmasse zwischen 700 und 1200 g liegen wird?

  5. (e)

    Überprüfen Sie mit einem QQ-Plot und dem Prognose-Modell von (d): Ist die Modellannahme sinnvoll, dass gemessene Fischmassen normalverteilt um die mittlere Fischmasse streuen?

10.8

Ultrakurze Laserimpulse mit einer Dauer von einigen Femtosekunden können in Halbleitern Terahertz-Pulse im Picosekundenbereich erzeugen und damit Löcher bohren. Dies erlaubt es, Eigenschaften des Materials über den mittleren Durchmesser \(\mu_{D}\) der Bohrlöcher zu bestimmen. Der Durchmesser wurde in 4; mittels einer Versuchsreihe im Laserlabor der Berner Fachhochschule an einem mit ps-Pulsen mit einer Wellenlänge von 532 nm bestimmt. Als Modellannahme gilt: Einzelne gebrannte Durchmesser streuen normalverteilt um den mittleren Durchmesser. Hier die Resultate von sieben gebrannten Löchern (in \(\upmu\)m):

$$102{,}70\quad 111{,}18\quad 108{,}36\quad 109{,}78\quad 97{,}02\quad 106{,}94\quad 106{,}00$$

Weitere Information zu den Durchmessern liegt nicht vor.

  1. (a)

    Überprüfen Sie, ob die Messwerte unter statistischer Kontrolle sind.

  2. (b)

    Bestimmen Sie die Plausibilität zu \(\mu_{D}\). Zeichnen Sie dazu den Graphen der A posteriori-Dichtefunktion, nennen Sie den Modus und bestimmen Sie Wahrscheinlichkeitsintervalle zum Niveau 0,5 und 0,95.

  3. (c)

    Wie lautet die A posteriori-Dichtefunktion für σ? Zeichnen Sie dazu den Graphen dieser Verteilung. Was ist der „wahrscheinlichste“ Wert für σ?

  4. (d)

    In welchem Bereich liegen mit einer Wahrscheinlichkeit von 0,5 und 0,95 gemessene Durchmesser der Bohrlöcher?

10.9

Bei einem Produktionsverfahren wird Wasser benutzt. Das nach der Produktion ausgeschüttete Wasser enthält Silberionen. Dabei interessiert der durchschnittliche Gehalt \(\mu_{S}\) an Silberionen im Abwasser. Als Datenmodell habe man die Normalverteilung. Hier die Resultate von fünf Messungen des Gehalts an Silberionen (in \(\upmu\)g/L):

$$9{,}8\quad 10{,}2\quad 10{,}7\quad 9{,}5\quad 10{,}5$$
  1. (a)

    Überprüfen Sie, ob die Messwerte unter statistischer Kontrolle sind.

  2. (b)

    Bestimmen Sie die Plausibilität \(\mathbb{P}(\mu_{S}\,|\,\text{Daten})\). Zeichnen Sie dazu den Graphen der A posteriori-Dichtefunktion, nennen Sie den Modus und bestimmen Sie Wahrscheinlichkeitsintervalle zum Niveau 0,5 und 0,95.

  3. (c)

    Wie lautet die A posteriori-Dichtefunktion für die Standardabweichung σ? Zeichnen Sie den Graphen dieser Verteilung. Was ist der „wahrscheinlichste“ Wert für σ?

  4. (d)

    Berechnen Sie Wahrscheinlichkeitsintervalle zum Niveau von 0,5, 0,9 und 0,95 für die Standardabweichung σ mit den in Anhang .1 erwähnten Formeln.

  5. (e)

    In welchem Bereich würden mit einer Wahrscheinlichkeit von 0,5 und 0,95, weitere Messungen des Gehalts an Silberionen liegen?

Rights and permissions

Reprints and permissions

Copyright information

© 2015 Springer-Verlag Berlin Heidelberg

About this chapter

Cite this chapter

Bättig, D. (2015). Streuung und Normalverteilung. In: Angewandte Datenanalyse. Statistik und ihre Anwendungen. Springer Spektrum, Berlin, Heidelberg. https://doi.org/10.1007/978-3-662-43394-2_10

Download citation

Publish with us

Policies and ethics