Inferenzstatistik

Sauer, Sebastian

doi:10.1007/978-3-658-21587-3_16

Sebastian Sauer³

Part of the book series: FOM-Edition ((FOMEDITION))

41k Accesses

Zusammenfassung

Dieses Kapitel führt in eine moderne Variante der Inferenzstatistik ein: Der Computer wird angewiesen, viele Stichproben aus einer Population (z.B. laut der Nullhypothese) zu ziehen; man bezeichnet dieses Vorgehen als Simulation. Auf dieser Basis werden dann Aussagen über die Passung eines Datensatzes zu der Population laut Hypothese vorgebracht. Neben einigen konzeptionellen Grundlagen wie dem Bootstrapping wird die Umsetzung dieser Simulationsverfahren in R ausführlich erläutert. Das R-Paket mosaic stellt komfortable Befehle für diesen Zweck zur Verfügung.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Log in via an institution

Chapter: USD 29.95; Price excludes VAT (USA)

eBook: USD 39.99; Price excludes VAT (USA)

Softcover Book: USD 49.99; Price excludes VAT (USA)

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Notes

1.
Die Inferenzstatistik wird oft als Mischung der Ansätze von Fisher (1955) und Neyman und Pearson (1933) dargestellt; besser wäre, die beiden Theorien auseinanderzuhalten. Auch in diesem Buch wird jedoch der Einfachheit halber nicht zwischen den beiden Ansätzen unterschieden. Eine gute Aufschlüsselung der Unterschiede findet sich bei Gigerenzer (2004).
2.
https://imgflip.com/i/22q4jc.
3.
Der Term „Signifikanz-Hypothesen-Inferenz-Testen“ hat sich nicht durchgesetzt.
4.
Das ist genau das Gegenteil von dem, was Herr Popper mit seiner Idee des Falsifizierens meinte: Man soll versuchen, seine eigene Hypothese zu falsifizieren, nicht versuchen, sie zu schätzen, indem man die $H_{0}$ testet. Außerdem sollte es so sein, dass mit steigender Genauigkeit einer Messung bzw. mit größerer Stichprobe eine Hypothese leichter falsifiziert werden müsste: Meine Hypothese beharrt auf einen gewissen Wert, 42.701. Experimente mit besserem Design, also genaueren Ergebnissen, sollten eine härtere Prüfung für meine Hypothese sein, also leichter zu falsifizieren sein: Genauere Prüfung lässt eine Behauptung schneller als falsch erkennen. Mit dem gängigen Vorgehen verhält es sich aber genau andersherum: Größere Stichproben werden meine Hypothese zunehmend in einem günstigeren Licht erscheinen lassen. Diese und weitere Probleme mit dem $p$-Wert in den Sozialwissenschaften sind im klassischen Artikel von Meehl (1978) herausgearbeitet.
5.
Diese Methode, wie sie hier dargestellt und meist gelehrt wird, ist eine Mischung aus der von Fisher (1955) und der von Neyman und Pearson (1933). Eine genauere Auseinandersetzung findet sich bei Gigerenzer (2004) oder Eid et al. (2010).
6.
Wir sparen uns hier die Diskussion, ob es faire Münzen gibt (vgl. Jaynes (2003)).
7.
Die 5 %-Grenze sieht sich auch Kritik ausgesetzt (vgl. Benjamin et al. (2018)).
8.
ASA: http://www.amstat.org/.
9.
S. fortunes::fortune(264).
10.
http://www.methodenberatung.uzh.ch/de/datenanalyse.html.
11.
https://www.aerzteblatt.de/archiv/74880/Auswahl-statistischer-Testverfahren.
12.
Damit haben wir die Variable Kater dichotomisiert; das ist nachteilig, s. fortunes::fortune(279).
13.
Ohne mosaic: chisq.test(x = extra$sex, extra$viel_saeufer).
14.
Die verschiedenen Stufen einer Variablen kann man sich so ausgeben lassen: extra %>% distinct(clients_freq).
15.
Das Paket magrittr stellt die „Dollar-Pfeife“ %$% zur Verfügung, so dass man diesen Aufruf in gewohnter Pfeifen-Manier schreiben kann: extra %$% cor.test(extra_mean, n_facebook_friends).
16.
Konfidenzintervalle werden meist zweiseitig angegeben; aber auch einseitige sind möglich, vgl. Eid et al. (2010).
17.
Nach Gelman (2014) (Kommentar um 08:15 pm) wird das Konfidenzintervall in der Praxis immer so interpretiert.
18.
Hier findet sich eine schöne interaktive Visualisierung zum Konfidenzintervall: http://rpsychologist.com/d3/CI/.
19.
https://imgflip.com/i/22waqa.
20.
Vgl. https://en.wikipedia.org/wiki/List_of_average_human_height_worldwide; angegeben ist hier Mittelwert plus/minus SD.
21.
Wahrscheinlich habe ich gerade einen Konfidenzfehler begangen.
22.
https://twitter.com/TheTweetOfGod/status/688035049187454976.
23.
https://jasp-stats.org/.
24.
F, F, R, F, R, F, F, R, R, R.
25.
library(pwr); pwr.anova.test(k = 3, f = 0.1, power = .8).
26.
Z. B. das Odds Ratio.
27.
Z. B. mit dem $\chi^{2}$-Test.
28.
?pwr liefert folgende Hinweise (wenn das Paket vorher geladen wurde): „Basic Functions for Power Analysis pwr“ und als Beschreibung (Description): „Power calculations along the lines of Cohen (1988) using in particular the same notations for effect sizes. Examples from the book are given.“

Author information

Authors and Affiliations

FOM Hochschule für Oekonomie & Management, Nürnberg, Deutschland
Sebastian Sauer

Authors

Sebastian Sauer
View author publications
You can also search for this author in PubMed Google Scholar

Corresponding author

Correspondence to Sebastian Sauer .

Rights and permissions

Reprints and permissions

Copyright information

About this chapter

Cite this chapter

Sauer, S. (2019). Inferenzstatistik. In: Moderne Datenanalyse mit R. FOM-Edition. Springer Gabler, Wiesbaden. https://doi.org/10.1007/978-3-658-21587-3_16

Download citation

DOI: https://doi.org/10.1007/978-3-658-21587-3_16
Published: 30 January 2019
Publisher Name: Springer Gabler, Wiesbaden
Print ISBN: 978-3-658-21586-6
Online ISBN: 978-3-658-21587-3
eBook Packages: Business and Economics (German Language)

Publish with us

Policies and ethics