Skip to main content

Eine Einführung und ein Überblick

  • Chapter
  • First Online:
Angewandte Datenanalyse

Part of the book series: Statistik und ihre Anwendungen ((STATIST))

  • 6984 Accesses

Zusammenfassung

Das Kapitel zeigt Werkzeuge, die in diesem Buch benutzt werden, um Daten zu analysieren. So erhält die Leserin oder der Leser einen ersten Eindruck, wie solche Werkzeuge funktionieren, ohne zu erwarten, dass die Details zu diesem Zeitpunkt verstanden werden. Insbesondere messen die Werkzeuge, wie plausibel Aussagen sind. Vorgestellt werden dabei die zwei wichtigsten Rechenregeln, um Plausibilitäten zu bestimmen. Einerseits ist dies die Regel von Bayes, die es erlaubt, Aussagen zu nicht direkt messbaren Grössen zu quantifizieren. Andererseits ist dies das Gesetz der Marginalisierung, mit dem man versuchen kann, zukünftige Beobachtungen einer unsicheren Grösse zu prognostizieren. Auch erfährt der Leser oder die Leserin, wie man die Statistik im Bereich der Qualitätssicherung einsetzen kann.

„Auf die Plätze!“ schrie die Königin mit

Donnerstimme, und sogleich rannte alles blind drauflos und

stolperte übereinander; nach einer Weile aber hatten sich alle

ordentlich aufgestellt, und das Spiel begann.

Lewis Carroll, Alice im Wunderland (Insel Taschenbuch, 1973, S. 85)

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 29.99
Price excludes VAT (USA)
  • Available as EPUB and PDF
  • Read on any device
  • Instant download
  • Own it forever

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Notes

  1. 1.

    Bei 96 Personen, die Malaria hatten, zeigte der OptiMAL-Test 89 mal positiv. Daher ist \(\text{Sensitivit{\"a}t}=89/96=0{,}927\).

  2. 2.

    Bei der erwähnten Studie wurde der OptiMAL-Test bei 106 Personen ohne Malaria angewendet. Bei 104 Personen war das Testresultat auch negativ. Somit ist \(\text{Spezifit{\"a}t}=104/106=0{,}981\).

  3. 3.

    Wichtig ist: die Wahrscheinlichkeit von \(30\,\%\) ist Ausdruck bei gegebenem Wissen der Ärztin. Eine zweite Ärztin wird mit ihrer Vorinformation oder ihrer Erfahrung eine andere Wahrscheinlichkeit setzen. Wahrscheinlichkeiten hängen also von der gegebenen Information ab.

  4. 4.

    Die Regel von Bayes wird später im Buch erklärt.

  5. 5.

    Der Faktor ist bei positivem Test \(\text{Faktor}_{\text{pos}}={\text{Sensitivit{\"a}t}}/{(1-\text{Spezifit{\"a}t})}\). Bei negativem Test ist \(\text{Faktor}_{\text{neg}}={(1-\text{Sensitivit{\"a}t})}/{\text{Spezifit{\"a}t}}\).

  6. 6.

    Die Rechnung wird später erklärt.

  7. 7.

    Konfundieren heisst vermengen oder durcheinander geraten.

  8. 8.

    Was statistische Prozessregelung genau umfasst, findet man in 1; . Beispiele, wie die statistische Prozessregulierung erfolgreich bei Unternehmen eingesetzt wurde, finden sich in 5; .

  9. 9.

    Das Beispiel wurde von E. Wyler (Berner FH) zur Verfügung gestellt. Es entstand durch eine Computersimulation.

  10. 10.

    Wie dies gerechnet wurde, wird später erklärt.

  11. 11.

    Das Phänomen, dass Screenings bei medizinischen Krankheiten, die nur kleine Teile der Bevölkerung betreffen, nicht sinnvoll sind, wird oft vergessen. Man hört etwa, dass alle Frauen regelmässig auf Brustkrebs zu untersuchen sind, oder alle sexuell aktiven Leute sich einem Aids-Test unterziehen sollten. Abgesehen von den horrenden Kosten spricht auch die in (c) gemachte Rechnung gegen so umfassende Abklärungen.

  12. 12.

    Einen Überblick zu Strategien, um „verlorene“ Objekte mit grösstmöglichster Wahrscheinlichkeit zu finden, findet man in 7; und 8; .

Literatur

  1. D.S. Chambers, D.J. Wheeler, Understanding Statistical Process Control (SPC-Press, Inc., 1992)

    Google Scholar 

  2. P.A.C. Gane, M. Buri, D.C. Spielmann, B. Neuenschwander, H. Scheidiger, D. Bättig, Mechanism of Post-Print Laser Marking on Coated Substrates: Factors Controlling Ink Ablation in the Application of High Brightness Calcium Carbonate. Journal of Graphic Technology 1 (2002)

    Google Scholar 

  3. J. Gastwirth, The statistical precision of medical screening procedures. Statistical Science 3, 213–222 (1987)

    Article  MathSciNet  Google Scholar 

  4. E.T. Jaynes, Papers on Probability, Statistics and Statistical Physics (Kluwer Academic Publishers, 1989), S. 155. herausgegeben von R.D. Rosenkrantz

    Google Scholar 

  5. M.J. Kiemle, S.R. Schmidt, R.J. Berdine, Basic Statistics, Tools for Continous Improvement, 4. Aufl. (Air Academy Press & Associates, LLC, 2000)

    Google Scholar 

  6. C.J. Palmer, J.F. Lindo, W.I. Klaskala, J.A. Quesada, R. Kaminski, M.K. Baum, A.L. Ager, Evaluation of the OptiMAL test for rapid diagnosis of Plasmodium vivax and Plasmodium falciparum malaria. J. Clin. Microbiol. 36(1) (1998)

    Google Scholar 

  7. L.D. Stone, The proces of search planning: current approaches and continuing problems. Oper. Res. 31, 207–233 (1983)

    Article  Google Scholar 

  8. L.D. Stone, In search of Air France Flight 447. INFORMS-Today 38, 4 (2011). http://www.informs.org/ORMS-Today/Public-Articles/August-Volume-38-Number-4/In-Search-of-Air-France-Flight-447

    Google Scholar 

Download references

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to Daniel Bättig Prof. Dr. .

Reflexion

Reflexion

1.1

Ein Ärztin glaubt, dass der Patient X Malaria hat. Sie schätzt dabei die Chance mit \(\mathbb{O}(X\text{ hat Malaria }|\text{ Vorwissen }{\cal K})=20:80\).

  1. (a)

    Der OptiMAL-Test schlägt positiv aus. Mit welcher (aktualisierter) Chance muss die Ärztin rechnen, dass der Patient von Malaria betroffen ist? Welche Chance erhält die Ärztin, wenn der Test negativ ausfällt? Beschreiben Sie die berechneten Chancen auch mit Wahrscheinlichkeiten.

  2. (b)

    Was passiert, wenn die Ärztin einen positiven OptiMAL-Test erhält, wenn sie davon ausgeht, dass der Patient eine Chance von nur 1 : 99 hat, Malaria zu haben?

  3. (c)

    Mit dem Test OptiMAL, der eine hohe Sensitivität und Spezifität hat, könnte man alle Tropenreisenden, die in die Schweiz einreisen, auf Malaria untersuchen. Man nennt dieses Verfahren ein Screening oder eine „Fishing expedition“ (einen Fischzug). Ist dies sinnvoll? Gehen Sie davon aus, dass jeder tausendste Tropenreisende an Malaria erkrankt.Footnote 11

1.2

Eine Equipe sucht einen Flugschreiber auf dem Meeresgrund in einem Gebiet von 10 km\({}^{2}\). Sie geht davon aus, dass der Flugschreiber sich dort mit einer Chance von 1 : 1 (oder einer Wahrscheinlichkeit von 50 %) befindet. Um den Flugschreiber zu finden, wird eine Methode benutzt, die eine Richtigpositiv-Rate von 0,6 und eine Richtignegativ-Rate von 1 hat.Footnote 12

  1. (a)

    Erklären Sie, was Richtigpositiv-Rate und Richtignegativ-Rate hier bedeuten. Warum muss die Richtignegativ-Rate 1 sein?

  2. (b)

    Der Einsatz der Methode liefert keinen Hinweis auf den Flugschreiber. Wie gross ist die aktualiserte Chance, dass der Flugschreiber sich im Gebiet befindet? Wie lautet diese Chance mit einer Wahrscheinlichkeit?

  3. (c)

    Eine zweite Methode mit gleicher Sensitivität und Spezifität wird nun eingesetzt. Auch diese Methode liefert keinen Hinweis auf den Flugschreiber. Wie gross ist die aktualiserte Chance, dass der Flugschreiber sich im Gebiet befindet? Wie lautet diese Chance mit einer Wahrscheinlichkeit?

1.3

Eine Person geht davon aus, dass es morgen an ihrem Wohnsitz mit einer Wahrscheinlichkeit von 60 % regnen wird.

  1. (a)

    Mit welcher Chance rechnet die Person, dass es morgen an ihrem Wohnsitz regnen wird?

  2. (b)

    Die Person geht davon aus, dass der Wetterdienst bei einer Regenmeldung eine Richtigpositiv-Rate von 0,9 und eine Richtignegativ-Rate von 0,8 hat. Erklären Sie, was diese zwei Zahlen hier genau bedeuten.

  3. (c)

    Eine Stunde später meldet der Wetterdienst, dass es morgen tatsächlich regnen wird. Von welcher aktualisierten Chance und Wahrscheinlichkeit muss die Person ausgehen, dass es morgen an ihrem Wohnsitz regnen wird?

1.4

Kommissar Huber verdächtigt 100 Personen einer Kleinstadt, einen Mord begangen zu haben. Alle Personen verneinen den Verdacht. Um den Täter unter den 100 Personen zu finden, will der Kommissar einen Lügendetektor einsetzen. Dieser hat nach 3; eine Sensitivität von \(0{,}88\) und eine Spezifität von \(0{,}86\).

  1. (a)

    Erklären Sie, was Sensitivität und Spezifität hier bedeuten.

  2. (b)

    Wie gross setzt der Kommissar die Wahrscheinlichkeit, dass eine Person den Mord begangen hat? Wie lautet diese Wahrscheinlichkeit mit einer Chance?

  3. (c)

    Ist der Einsatz des Lügendetektors sinnvoll? Berechnen Sie dazu die Chance und anschliessend die Wahrscheinlichkeit, dass die Person den Mord begangen hat, wenn der Lügendetektor ausschlägt.

1.5

Der PSA-4.0-Test wird in der Medizin verwendet, um bei Vorsorgeuntersuchungen Prostatakrebs zu entdecken. Nach mediXSchweiz (Gesundheitsdossier Prostatavergrösserung, 2009) ist die Spezifität des Tests ist 0,93. Die Sensitivität ist jedoch lediglich 0,2.

  1. (a)

    Ein Arzt vermutet nach einem Gespräch mit einem Mann, dass dieser Mann Prostatakrebs hat. Er setzt die Chance auf 2 : 3. Wie gross ist die aktualisierte Chance, dass der Mann Prostatakrebs hat, wenn der Test positiv ausschlägt?

  2. (b)

    Man geht davon aus, dass von 1000 Männern im Alter zwischen 50 und 70 Jahren 25 Prostatakrebs haben. Ist es für einen Arzt sinnvoll den PSA-4.0-Test bei all seinen männlichen Patienten im Alter zwischen 50 und 70 Jahren einzusetzen?

1.6

Sie benutzen das folgende einfache Instrument, um bei einer Person Malaria zu detektieren: Sie werfen eine Münze, fällt sie auf „Kopf“, so sagen Sie, dass die Person Malaria hat. Fällt die Münze auf „Zahl“, so ist das Testresultat negativ.

  1. (a)

    Wie lautet die Sensitivität und die Spezifität des Instruments?

  2. (b)

    Was liefert die Regel von Bayes bei diesem Instrument? Erstaunt Sie das Resultat?

1.7

Eine Firma produziert elektrische Teile. Die Produktionschefin geht davon aus, dass rund 1 % der produzierten Teile defekt sind. Weiter kann sie die produzierten Teile mit einer Apparatur testen. Dabei besteht eine Wahrscheinlichkeit von 0,975, dass ein von der Apparatur als defekt bezeichnetes Teil auch defekt ist und eine Wahrscheinlichkeit von 0,999, dass ein als nicht defekt bezeichnetes Teil nicht defekt ist.

  1. (a)

    Wie lauten die Sensitivität und die Spezifität des Tests mit der Apparatur?

  2. (b)

    Wie gross ist für die Produktionschefin die Chance, das ein zufällig gewähltes Teil defekt ist?

  3. (c)

    Die Produktionschefin wählt ein elektrisches Teil der Produktion. Die Apparatur meldet es defekt. Wie gross ist (1) die aktualisierte Chance und (2) die aktualisierte Wahrscheinlichkeit, dass das produzierte Teil wirklich defekt ist?

  4. (d)

    Die Apparatur meldet bei einem produzierten elektrischen Teil, dass es nicht defekt ist. Wie gross ist die Chance, dass das produzierte Teil wirklich nicht defekt ist?

1.8

Aus der Gratiszeitung 20-Minuten vom 18. Oktober 2004: Unfall beim Freizeitsport Die Zahl der Freizeitunfälle hat zugenommen. Wir wollten darum wissen, ob unsere Leser sich schon einmal beim Freizeitsport verletzt haben. 1031 Teilnehmer (52 %) der 20-Minuten-Internetumfrage beantworteten die Frage mit Nein. Teilnehmertotal: 2003. Welches grundsätzliche Problem birgt eine solche Internet-Umfrage?

1.9

Tabelle 1.8 zeigt den von der Regierung der USA festgelegten Minimallohn pro Stunde aus den Jahren 1960 bis 1995, die Arbeitgeber ihren Arbeitern zahlen müssen.

Tab. 1.8 Minimallohn pro Stunde in Dollar aus den Jahren 1960 bis 1995 in den USA
  1. (a)

    Zeigen Sie mit einer geeigneten Grafik, wie sich der Minimallohn entwickelt hat. Benutzen Sie zur Umrechnung auf reale Dollar von 1960 Tab. 1.9.

    Tab. 1.9 Die Preisentwicklung der Konsumentenpreise in den USA
  2. (b)

    Wie würde die Grafik aussehen, wenn nur die nicht-inflationsbereinigten Minimallöhne pro Stunde dargestellt würden? Kommentieren Sie die erhaltene Grafik.

  3. (c)

    Das Medianeinkommen pro Haushalt betrug in den USA im Jahr 1980 $ 17 710. Dies bedeutet, dass 50 % der Haushalte in den USA ein Einkommen von weniger als $ 17 710 hatten und 50 % ein Einkommen über diesem Wert. Im Jahre 1999 betrug das Medianeinkommen $ 40 816. Um wie viel Prozent hat das Medianeinkommen zugenommen? (Hinweis: Für das Jahr 1999 beträgt der CPI 166,6.)

1.10

Die Beratungsfirma Heidrick & Struggles hat untersucht, ob die Lohnhöhe von Verwaltungsratsmitgliedern mit der Qualität ihrer Arbeit, basierend auf 41 Kriterien, zusammenhängt. Resultate von 13 Ländern in Europa finden sich in Tab. 1.10.

Tab. 1.10 Durchschnittlicher Verdienst von Verwaltungsratsmitgliedern und Qualität (Heidrick & Struggles, 2009, Daten aus Le Monde, 26.3.2009)

Stellen Sie die Messpunkte in einem Streudiagramm dar. Sind aussergewöhnliche Beobachtungen vorhanden? Handelt es sich um Messwerte aus einem Experiment oder um Beobachtungen?

1.11

Tabelle 1.11 zeigt die Ausgaben der öffentlichen Hand für Forschung und Entwicklung von neun Regionen in Europa.

Tab. 1.11 Ausgaben für Forschung und Entwicklung (BIP ist das Bruttoinlandsprodukt, aus: Eurostat)

Ist es möglich, eine Rangliste der Regionen nach ihren Ausgaben für Forschung und Entwicklung zu machen?

1.12

Die Staaten der Europäischen Union publizieren jeden Monat ihre Arbeitslosenquoten. Versuchen Sie herauszufinden, ob die Quoten bei allen Staaten gleich gemessen werden und damit die Daten verglichen werden können.

1.13

Tabelle 1.12 zeigt den Jahresdurchschnittspreis (in CHF) von Benzin (Bleifrei 95) und die Preisentwicklung in der Schweiz (Landesindex der Konsumentenpreise) in den Jahren 1970–2010.

Tab. 1.12 Jahresdurchschnittspreis (in CHF) von Benzin (Bleifrei 95) und Preisentwicklung in der Schweiz (Landesindex der Konsumentenpreise) in den Jahren 1970–2010
  1. (a)

    Zeigen Sie mit einer geeigneten Grafik, wie sich der Benzinpreis entwickelt hat.

  2. (b)

    Um wie viel Prozent hat der Benzinpreis vom Jahr 1970 bis zum Jahr 2010 zu- oder abgenommen?

1.14

In Zeitungen und Zeitschriften finden sich viele Analysen zu Daten. Finden Sie heraus: Handelt es sich jeweils um Messwerte aus Experimenten oder Daten aus Beobachtungen?

1.15

Chloridgehalte von Lösungen können mit einer Methode, die auf elektrische Ladungen in Molekülen basiert, bestimmt werden. Hier zehn Messungen (in mol/m\({}^{3}\)) einer Kalium-Chloridlösung:

$$108{,}7\quad 110{,}9\quad 101{,}1\quad 102{,}5\quad 100{,}1\quad 101{,}9\quad 105{,}8\quad 106{,}0\quad 104{,}1\quad 105{,}1$$

Die Messungen variieren, da die Umwelteinflüsse auf die Experimentierkammer nicht konstant gehalten werden können und die Messinstrumente Ungenauigkeiten haben. Hat es Trends oder zyklische Muster in den Daten? War das Experiment unter statistischer Kontrolle?

1.16

Die Firma Tillamook-Cheese in Oregon (USA) produziert quaderförmige Frischkäsekörper mit einer mittleren Masse von etwa 19 kg. Die Körper werden gereift und anschliessend für den Handel in kleine Portionen von 500–1000 Gramm zerschnitten. Zur Qualitätskontrolle müssen neben der Zusammensetzung der Körper auch die durchschnittliche Masse und die Streuung der Massen einer Tagesproduktion berechnet werden. Tabelle 1.13 zeigt 20 Messungen von Massen von Frischkäsekörpern.

Tab. 1.13 20 Messungen von Frischkäsekörpern vom 18. Juli 2008 (Angaben in amerikanischen Pfund, Reihenfolge der Daten entlang der Spalten)

Überprüfen Sie, ob die Messwerte keine Trends zeigen. Deuten die Messwerte darauf hin, dass die Firma ihre Produktion unter statistischer Kontrolle hat?

1.17

Zeichnen Sie ein Streudiagramm der Schadensummen der Unwetter in der Schweiz während den Jahren 1977 bis 1997. Hat es Trends oder sind zyklische Muster aus den Daten ableitbar?

1.18

Eine Messmethode, um eine nicht direkt messbare Grösse K zu ermitteln, funktioniere „korrekt“: Mit einer Wahrscheinlichkeit von 50 % liegen Messwerte unterhalb von K und mit einer Wahrscheinlichkeit von 50 % oberhalb von K.

  1. (a)

    Wie gross ist die Wahrscheinlichkeit, dass bei zwei Messungen beide Messwerte grösser als K sein werden?

  2. (b)

    Berechnen Sie die Wahrscheinlichkeit, dass bei drei Messungen der kleinste Messwert kleiner und der grösste Messwert grösser als K sein wird. (Tipp: Listen Sie alle möglichen Fälle auf.)

1.19

Abbildung 1.8 zeigt zwei Messreihen einer Prozessgrösse. Normale, variierende Produktionsbedingungen bewirken, dass in der linken Grafik der letzte Messwert höher als der zweitletzte Messwert ist. In der rechten Grafik ist dies kaum der Fall.

Im Schweizer Fernsehen wird jeden Abend versucht, zu erklären, warum der Börsenindex höher oder tiefer als am Vortrag ist. Wie ist dies zu bewerten?

Abb. 1.8
figure 8

Zwei verschiedene Messreihen: links mit normaler Streuung, rechts mit einem aussergewöhnlichen Messwert

1.20

Die Gemeindepolizei Köniz führte im Jahr 2008 auf Strassen Geschwindigkeitskontrollen durch. Insbesondere ist es für sie interessant zu wissen, wie gross der Anteil der zu schnell fahrenden Fahrzeuge ist. So wurden gemäss dem Anzeiger Region Bern vom 8.2.2008 765 Fahrzeuge kontrolliert, 60 davon fuhren zu schnell. Sind die Daten Beobachtungen oder Messwerte eines Experiments?

Rights and permissions

Reprints and permissions

Copyright information

© 2015 Springer-Verlag Berlin Heidelberg

About this chapter

Cite this chapter

Bättig, D. (2015). Eine Einführung und ein Überblick. In: Angewandte Datenanalyse. Statistik und ihre Anwendungen. Springer Spektrum, Berlin, Heidelberg. https://doi.org/10.1007/978-3-662-43394-2_1

Download citation

Publish with us

Policies and ethics