Zusammenfassung
Goodness-of-fit-Maße geben an, wie gut die angepasste Funktion, also die „gefittete“ mit den tatsächlich vorliegenden Beobachtungsdaten übereinstimmt. Das bekannteste aller Goodness-of-fit-Maße ist R2 bzw. der sogenannte Determinationskoeffizient, der angibt, welcher Anteil der Varianz der abhängigen Variablen Y durch die gefundene Regressionsfunktion erklärt werden kann. Da GOF-Maße die Güte eines Modells mit einer einzigen Zahl relativ prägnant darstellen, sind sie auch in generalisierten, linearen Modellen und vor allem auch bei Probit- und Logitmodellen sehr beliebt. Die bekanntesten GOF-Maße bezüglich logistischer Regressionen bauen auf der Devianz auf, wie z.B. McFadden’s Pseudo-R2, oder auf der Likelihood wie Cox und Snell’s R2 und Nagelkerkes R2. Auf diesen Konzepten bauen auch Signifikanztests wie der Likelihood-Ratio-Test auf. Für die Beurteilung verschiedener Modelle sind inzwischen auch die Infomrationskriterien AIC und BIC sehr beliebt.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Notes
- 1.
Bezüglich der zahlreichen Konzepte für Pseudo-R2 bei der logistischen Regression bzw. verschiedenen GLM-Modellen (generalized linear models) gilt Stigler’s Gesetz der Eponymie (Stigler 1999), nach dem eine Entdeckung fast niemals nach ihrem ersten Urheber benannt ist, in vielerlei Hinsicht und sorgt mitunter für Verwirrung. So wird McFadden’s R2 z. B. von Andy Field etwas irritierend als Hosmer und Lemeshow’s R2 bezeichnet (Field et al. 2012, S. 317). Nagelkerke’s R2 wird in der pR2-Funktion des R-package pscl von Simon Jackman als Cragg und Uhler’s R2 bezeichnet, während Cox und Snell’s R2 schlicht als Maximum Likelihood Pseudo-R2 bezeichnet wird. Ich halte hier an den Bezeichnungen fest, die sich verbreitet haben, Stigler’s Gesetz zum Trotz bzw. als eine weitere dieses womöglich verifizierende Instanz.
- 2.
Die Verwendung des Begriffs „vollständiges Modell“ (full model) ist in der Statistikliteratur leider nicht einheitlich geregelt. Ich orientiere mich hier am Sprachgebrauch bei Long (1997, S. 94). Andere Autoren sprechen hier hingegen vom „saturierten Modell“, während der Begriff des vollständigen Modells, also dem „full model“ häufig einfach für das Modell mit allen Prädiktoren angewandt wird – in Abgrenzung zum Nullmodell – , also dem, was ich hier meistens als M1 bezeichne oder auch als spezifiziertes Modell bezeichnet habe. Da im letzteren Sinn der Begriff „full“ bzw. „vollständig“ willkürlich erscheint, da ja jedes nach dieser Auffassung „vollständige“ Modell durch die Aufnahme weiterer unabhängiger Variable in das erweiterte Modell eingeschachtelt werden kann, schließe ich mich der Terminologie von Long an.
Author information
Authors and Affiliations
Corresponding author
Rights and permissions
Copyright information
© 2015 Springer Fachmedien Wiesbaden
About this chapter
Cite this chapter
Behnke, J. (2015). Goodness-of-fit-Maße, Modellvergleiche und Signifikanztests. In: Logistische Regressionsanalyse. Methoden der Politikwissenschaft. Springer VS, Wiesbaden. https://doi.org/10.1007/978-3-658-05082-5_6
Download citation
DOI: https://doi.org/10.1007/978-3-658-05082-5_6
Published:
Publisher Name: Springer VS, Wiesbaden
Print ISBN: 978-3-658-05081-8
Online ISBN: 978-3-658-05082-5
eBook Packages: Humanities, Social Science (German Language)