Zusammenfassung
Dieses Kapitel stellt eine Auswahl typischer Probleme vor, auf die man beim Arbeiten mit echten Datensätzen immer wieder trifft. Dazu gehören der Umgang mit fehlenden Werten genauso wie das Umkodieren von Werten oder das Zusammenfassen von Zeilen eines Dataframes zu einem Wert.
This is a preview of subscription content, log in via an institution.
Buying options
Tax calculation will be finalised at checkout
Purchases are for personal use only
Learn about institutional subscriptionsNotes
- 1.
fortunes::fortune(52).
- 2.
mosaic::inspect() oder skimr::skim() bieten sich an.
- 3.
Prägnanter geht es so: sum(is.na(stats_test$self_eval)).
- 4.
sum(is.na(stats_test$score)).
- 5.
extra %>% select(i01:i10) %>% filter(complete.cases(.)) %>% nrow.
- 6.
Sie ist quadratisch, auf der Hauptdiagonalen steht NA, und gespiegelt an der Hauptdiagonalen, d. h., das obere Dreieck der Matrix ist redundant.
- 7.
head(extra).
- 8.
Es gibt auch weniger schöne Wege, um Spalten umzubenennen: names(stats_test)[names(stats_test) == ″bestanden″] <- ″jippiejey″.
- 9.
ggplot2 muss geladen sein; wenn man tidyverse lädt, wird ggplot2 automatisch auch geladen.
- 10.
Allerdings gibt es Pakete mit diesem Befehl, z. B. miscTools.
- 11.
F, R, F, F, F, R, F, F, F, R, R, R.
Author information
Authors and Affiliations
Corresponding author
Rights and permissions
Copyright information
© 2019 Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature
About this chapter
Cite this chapter
Sauer, S. (2019). Praxisprobleme der Datenaufbereitung. In: Moderne Datenanalyse mit R. FOM-Edition. Springer Gabler, Wiesbaden. https://doi.org/10.1007/978-3-658-21587-3_9
Download citation
DOI: https://doi.org/10.1007/978-3-658-21587-3_9
Published:
Publisher Name: Springer Gabler, Wiesbaden
Print ISBN: 978-3-658-21586-6
Online ISBN: 978-3-658-21587-3
eBook Packages: Business and Economics (German Language)