Zusammenfassung
In diesem Kapitel studieren Sie einen Fall angelehnt an die klassifizierende Regression. Es geht um die Frage, welche Variablen mit Überleben (vs. Ertrinken) auf der Titanic assoziiert sind – also um eine Klassifikation. Nachdem Sie zu Beginn eine explorative Analyse durchgeführt haben, garniert mit einigen statistischen Tests und zugehörigen Effektstärken, berechnen Sie ein binär-logistisches Modell.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Notes
- 1.
Yet-another-case-study-on-data-analysis.
- 2.
12 Variablen bzw. 891 Fälle.
- 3.
Z. B. mit titanic_train %>% count(Survived) oder titanic_train %>% summarise(Ticketpreis = mean(Fare, na.rm = TRUE)).
- 4.
Sie finden sie in der Hilfeseite des Datensatzes: help(titanic_train).
- 5.
Z. B. qplot(x = Pclass, y = n, data = c1); Der Befehl qplot zeichnet automatisch Punkte, wenn auf beiden Achsen „Zahlen-Variablen“ stehen (also Variablen, die keinen „Text“, sondern nur Zahlen beinhalten. In R sind das Variablen vom Typ int (integer), also ganze Zahlen oder vom Typ num (numeric), also reelle Zahlen).
- 6.
c2 <- dplyr::count(titanic_train, Survived).
- 7.
p2 + labs(x = ″Klasse″, title = ″Überleben auf der Titanic″, fill = ″Überlebt?″, y = Änteil″).
- 8.
t2_chi <- xchisq.test(Survived ~ Pclass, data = t2); Ein \(\chi^{2}\)-Wert von 96 resultiert. Mit sum(c4) kann man sich die Stichprobengröße ausgeben lassen.
- 9.
Auf der Webseite von Cynthia Brewer kann man sich Farbpaletten zusammenstellen lassen, auch nach der Maßgabe kopiererfreundlich (s. auch Abschn. 12.1.1).
- 10.
R, R, R, F, F, F, R, R, R, F.
Author information
Authors and Affiliations
Corresponding author
Rights and permissions
Copyright information
© 2019 Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature
About this chapter
Cite this chapter
Sauer, S. (2019). Fallstudie: Titanic. In: Moderne Datenanalyse mit R. FOM-Edition. Springer Gabler, Wiesbaden. https://doi.org/10.1007/978-3-658-21587-3_20
Download citation
DOI: https://doi.org/10.1007/978-3-658-21587-3_20
Published:
Publisher Name: Springer Gabler, Wiesbaden
Print ISBN: 978-3-658-21586-6
Online ISBN: 978-3-658-21587-3
eBook Packages: Business and Economics (German Language)