Zusammenfassung
Zu Beginn werden einige wesentliche Gedanken der deskriptiven Statistik illustriert. Im Anschluss finden sich R-Befehle, um gängige univariate Statistiken zu berechnen. Der letzte Abschnitt erläutert zuerst grob, was man unter einer Korrelation versteht, und zeigt danach passende R-Befehle.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Notes
- 1.
Gibt es auch Situationen, in denen man einen Vektor in mehreren Kennwerten zusammenfassen möchte?
- 2.
Eine interessante Ergänzung und Alternative ist das Programm Exploratory, https://exploratory.io/, welches eine „klickbare“ Oberfläche für explorative Datenanalyse bietet. Die Software baut auf R auf, gibt die R-Syntax aus und ist eng an das Tidyverse angelehnt. Ähnliches gilt für die Software jamovi, https://www.jamovi.org/ und. Beide sind modern und aufgeräumt im Erscheinungsbild.
- 3.
Der Modus ist im Standard-R nicht mit einem eigenen Befehl vertreten. Man kann ihn aber leicht von Hand bestimmen, z. B. mit count(df, x) %>% arrange(-n) %>% top_n(1), wobei x die relevante Variable und df einen Dataframe darstellt. Es gibt auch einige Pakete, die diese Funktion anbieten: z. B. modes::modes().
- 4.
Der MAD ist im Standard-R nicht mit einem eigenen Befehl vertreten. Es gibt einige Pakete, die diese Funktion anbieten: z. B. lsr::aad (absolute average deviation from the mean).
- 5.
R, R, R, F, F, F, F, R, R.
- 6.
Ja: tally(bestanden ~ interest + self_eval, data = drop_na(stats_test).
- 7.
Zum Beispiel so: mean(stats_test$score, na.rm = TRUE).
- 8.
Vielleicht ist das Geschmackssache; dplyr vereinheitlicht die Syntax und führt viele Operationen auf eine Grundmenge an Bausteinen zurück, was in einigen Situationen hilfreich ist.
- 9.
drop_na() bezieht sich nur auf Dataframes; na.omit() kann auch Vektoren verarbeiten. drop_na() fügt sich in dplyr-Syntax; so können Variablennamen ohne Anführungsstriche übergeben werden.
- 10.
Ja; lädt man tidyverse, so wird angezeigt, welche Pakete geladen werden. Mit tidyverse_packages() kann man sich explizit aufzeigen lassen, welche Pakete geladen werden. Um genau zu sein, werden die Pakete nicht „geladen“, sondern an den Suchpfad angehängt; vgl. Wickham (2014).
- 11.
tally(interest ~ bestanden, data = stats_test).
- 12.
tally(interest ~ bestanden, data = stats_test, format = ″proportion″).
- 13.
?tally; das Argument lautet format = ″percent″.
- 14.
stats_test %>% count(study_time, bestanden) %>% group_by(bestanden) %>% mutate(prop = n / sum(n).
- 15.
favstats(score ~ interest, data = stats_test); inspect() bietet die Möglichkeit nicht.
Author information
Authors and Affiliations
Corresponding author
Rights and permissions
Copyright information
© 2019 Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature
About this chapter
Cite this chapter
Sauer, S. (2019). Deskriptive Statistik. In: Moderne Datenanalyse mit R. FOM-Edition. Springer Gabler, Wiesbaden. https://doi.org/10.1007/978-3-658-21587-3_8
Download citation
DOI: https://doi.org/10.1007/978-3-658-21587-3_8
Published:
Publisher Name: Springer Gabler, Wiesbaden
Print ISBN: 978-3-658-21586-6
Online ISBN: 978-3-658-21587-3
eBook Packages: Business and Economics (German Language)