Deskriptive Statistik

Sauer, Sebastian

doi:10.1007/978-3-658-21587-3_8

Sebastian Sauer³

Part of the book series: FOM-Edition ((FOMEDITION))

41k Accesses

Zusammenfassung

Zu Beginn werden einige wesentliche Gedanken der deskriptiven Statistik illustriert. Im Anschluss finden sich R-Befehle, um gängige univariate Statistiken zu berechnen. Der letzte Abschnitt erläutert zuerst grob, was man unter einer Korrelation versteht, und zeigt danach passende R-Befehle.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Log in via an institution

Chapter: USD 29.95; Price excludes VAT (USA)

eBook: USD 39.99; Price excludes VAT (USA)

Softcover Book: USD 49.99; Price excludes VAT (USA)

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Notes

1.
Gibt es auch Situationen, in denen man einen Vektor in mehreren Kennwerten zusammenfassen möchte?
2.
Eine interessante Ergänzung und Alternative ist das Programm Exploratory, https://exploratory.io/, welches eine „klickbare“ Oberfläche für explorative Datenanalyse bietet. Die Software baut auf R auf, gibt die R-Syntax aus und ist eng an das Tidyverse angelehnt. Ähnliches gilt für die Software jamovi, https://www.jamovi.org/ und. Beide sind modern und aufgeräumt im Erscheinungsbild.
3.
Der Modus ist im Standard-R nicht mit einem eigenen Befehl vertreten. Man kann ihn aber leicht von Hand bestimmen, z. B. mit count(df, x) %>% arrange(-n) %>% top_n(1), wobei x die relevante Variable und df einen Dataframe darstellt. Es gibt auch einige Pakete, die diese Funktion anbieten: z. B. modes::modes().
4.
Der MAD ist im Standard-R nicht mit einem eigenen Befehl vertreten. Es gibt einige Pakete, die diese Funktion anbieten: z. B. lsr::aad (absolute average deviation from the mean).
5.
R, R, R, F, F, F, F, R, R.
6.
Ja: tally(bestanden ~ interest + self_eval, data = drop_na(stats_test).
7.
Zum Beispiel so: mean(stats_test$score, na.rm = TRUE).
8.
Vielleicht ist das Geschmackssache; dplyr vereinheitlicht die Syntax und führt viele Operationen auf eine Grundmenge an Bausteinen zurück, was in einigen Situationen hilfreich ist.
9.
drop_na() bezieht sich nur auf Dataframes; na.omit() kann auch Vektoren verarbeiten. drop_na() fügt sich in dplyr-Syntax; so können Variablennamen ohne Anführungsstriche übergeben werden.
10.
Ja; lädt man tidyverse, so wird angezeigt, welche Pakete geladen werden. Mit tidyverse_packages() kann man sich explizit aufzeigen lassen, welche Pakete geladen werden. Um genau zu sein, werden die Pakete nicht „geladen“, sondern an den Suchpfad angehängt; vgl. Wickham (2014).
11.
tally(interest ~ bestanden, data = stats_test).
12.
tally(interest ~ bestanden, data = stats_test, format = ″proportion″).
13.
?tally; das Argument lautet format = ″percent″.
14.
stats_test %>% count(study_time, bestanden) %>% group_by(bestanden) %>% mutate(prop = n / sum(n).
15.
favstats(score ~ interest, data = stats_test); inspect() bietet die Möglichkeit nicht.

Author information

Authors and Affiliations

FOM Hochschule für Oekonomie & Management, Nürnberg, Deutschland
Sebastian Sauer

Authors

Sebastian Sauer
View author publications
You can also search for this author in PubMed Google Scholar

Corresponding author

Correspondence to Sebastian Sauer .

Rights and permissions

Reprints and permissions

Copyright information

About this chapter

Cite this chapter

Sauer, S. (2019). Deskriptive Statistik. In: Moderne Datenanalyse mit R. FOM-Edition. Springer Gabler, Wiesbaden. https://doi.org/10.1007/978-3-658-21587-3_8

Download citation

DOI: https://doi.org/10.1007/978-3-658-21587-3_8
Published: 30 January 2019
Publisher Name: Springer Gabler, Wiesbaden
Print ISBN: 978-3-658-21586-6
Online ISBN: 978-3-658-21587-3
eBook Packages: Business and Economics (German Language)

Publish with us

Policies and ethics