Zusammenfassung
Dieses Kapitel führt in eine moderne Variante der Inferenzstatistik ein: Der Computer wird angewiesen, viele Stichproben aus einer Population (z.B. laut der Nullhypothese) zu ziehen; man bezeichnet dieses Vorgehen als Simulation. Auf dieser Basis werden dann Aussagen über die Passung eines Datensatzes zu der Population laut Hypothese vorgebracht. Neben einigen konzeptionellen Grundlagen wie dem Bootstrapping wird die Umsetzung dieser Simulationsverfahren in R ausführlich erläutert. Das R-Paket mosaic stellt komfortable Befehle für diesen Zweck zur Verfügung.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Notes
- 1.
Die Inferenzstatistik wird oft als Mischung der Ansätze von Fisher (1955) und Neyman und Pearson (1933) dargestellt; besser wäre, die beiden Theorien auseinanderzuhalten. Auch in diesem Buch wird jedoch der Einfachheit halber nicht zwischen den beiden Ansätzen unterschieden. Eine gute Aufschlüsselung der Unterschiede findet sich bei Gigerenzer (2004).
- 2.
- 3.
Der Term „Signifikanz-Hypothesen-Inferenz-Testen“ hat sich nicht durchgesetzt.
- 4.
Das ist genau das Gegenteil von dem, was Herr Popper mit seiner Idee des Falsifizierens meinte: Man soll versuchen, seine eigene Hypothese zu falsifizieren, nicht versuchen, sie zu schätzen, indem man die \(H_{0}\) testet. Außerdem sollte es so sein, dass mit steigender Genauigkeit einer Messung bzw. mit größerer Stichprobe eine Hypothese leichter falsifiziert werden müsste: Meine Hypothese beharrt auf einen gewissen Wert, 42.701. Experimente mit besserem Design, also genaueren Ergebnissen, sollten eine härtere Prüfung für meine Hypothese sein, also leichter zu falsifizieren sein: Genauere Prüfung lässt eine Behauptung schneller als falsch erkennen. Mit dem gängigen Vorgehen verhält es sich aber genau andersherum: Größere Stichproben werden meine Hypothese zunehmend in einem günstigeren Licht erscheinen lassen. Diese und weitere Probleme mit dem \(p\)-Wert in den Sozialwissenschaften sind im klassischen Artikel von Meehl (1978) herausgearbeitet.
- 5.
Diese Methode, wie sie hier dargestellt und meist gelehrt wird, ist eine Mischung aus der von Fisher (1955) und der von Neyman und Pearson (1933). Eine genauere Auseinandersetzung findet sich bei Gigerenzer (2004) oder Eid et al. (2010).
- 6.
Wir sparen uns hier die Diskussion, ob es faire Münzen gibt (vgl. Jaynes (2003)).
- 7.
Die 5 %-Grenze sieht sich auch Kritik ausgesetzt (vgl. Benjamin et al. (2018)).
- 8.
ASA: http://www.amstat.org/.
- 9.
S. fortunes::fortune(264).
- 10.
- 11.
- 12.
Damit haben wir die Variable Kater dichotomisiert; das ist nachteilig, s. fortunes::fortune(279).
- 13.
Ohne mosaic: chisq.test(x = extra$sex, extra$viel_saeufer).
- 14.
Die verschiedenen Stufen einer Variablen kann man sich so ausgeben lassen: extra %>% distinct(clients_freq).
- 15.
Das Paket magrittr stellt die „Dollar-Pfeife“ %$% zur Verfügung, so dass man diesen Aufruf in gewohnter Pfeifen-Manier schreiben kann: extra %$% cor.test(extra_mean, n_facebook_friends).
- 16.
Konfidenzintervalle werden meist zweiseitig angegeben; aber auch einseitige sind möglich, vgl. Eid et al. (2010).
- 17.
Nach Gelman (2014) (Kommentar um 08:15 pm) wird das Konfidenzintervall in der Praxis immer so interpretiert.
- 18.
Hier findet sich eine schöne interaktive Visualisierung zum Konfidenzintervall: http://rpsychologist.com/d3/CI/.
- 19.
- 20.
Vgl. https://en.wikipedia.org/wiki/List_of_average_human_height_worldwide; angegeben ist hier Mittelwert plus/minus SD.
- 21.
Wahrscheinlich habe ich gerade einen Konfidenzfehler begangen.
- 22.
- 23.
- 24.
F, F, R, F, R, F, F, R, R, R.
- 25.
library(pwr); pwr.anova.test(k = 3, f = 0.1, power = .8).
- 26.
Z. B. das Odds Ratio.
- 27.
Z. B. mit dem \(\chi^{2}\)-Test.
- 28.
?pwr liefert folgende Hinweise (wenn das Paket vorher geladen wurde): „Basic Functions for Power Analysis pwr“ und als Beschreibung (Description): „Power calculations along the lines of Cohen (1988) using in particular the same notations for effect sizes. Examples from the book are given.“
Author information
Authors and Affiliations
Corresponding author
Rights and permissions
Copyright information
© 2019 Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature
About this chapter
Cite this chapter
Sauer, S. (2019). Inferenzstatistik. In: Moderne Datenanalyse mit R. FOM-Edition. Springer Gabler, Wiesbaden. https://doi.org/10.1007/978-3-658-21587-3_16
Download citation
DOI: https://doi.org/10.1007/978-3-658-21587-3_16
Published:
Publisher Name: Springer Gabler, Wiesbaden
Print ISBN: 978-3-658-21586-6
Online ISBN: 978-3-658-21587-3
eBook Packages: Business and Economics (German Language)