Skip to main content

Datenvisualisierung mit ggplot2

  • Chapter
  • First Online:
  • 41k Accesses

Part of the book series: FOM-Edition ((FOMEDITION))

Zusammenfassung

Ein Bild sagt mehr als 1000 Worte? Oder vielleicht doch nicht? Diese Fragen werden zu Beginn – wie sollte es anders sein – anhand einer Datenvisualisierung erörtert. Dann lernen Sie einige der umfangreichen Funktionen des Grafikpakets ggplot2. Einfache pragmatische Aspekte stehen im Vordergrund: Welche Diagramme bieten sich für welchen Zweck an? Was ist die Logik der Syntax von ggplot2? Wie kann man die bereits erlernten Techniken des Datenjudos sinnvoll für die Visualisierung verwenden?

This is a preview of subscription content, log in via an institution.

Buying options

Chapter
USD   29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD   39.99
Price excludes VAT (USA)
  • Available as EPUB and PDF
  • Read on any device
  • Instant download
  • Own it forever
Softcover Book
USD   49.99
Price excludes VAT (USA)
  • Compact, lightweight edition
  • Dispatched in 3 to 5 business days
  • Free shipping worldwide - see info

Tax calculation will be finalised at checkout

Purchases are for personal use only

Learn about institutional subscriptions

Notes

  1. 1.

    Eine coole Variante mit der gleichen Botschaft findet sich hier: https://www.autodeskresearch.com/publications/samestats; bzw. mit einer Animation hier: https://d2f99xq7vri1nk.cloudfront.net/DinoSequentialSmaller.gif; vgl. Matejka und Fitzmaurice (2017).

  2. 2.

    „gg“ steht für „grammer of graphics“ nach einem Buch von Wilkinson (2006); „plot“ steht für „to plot“, also ein Diagramm erstellen („plotten“); vgl. https://en.wikipedia.org/wiki/Ggplot2.

  3. 3.

    Edward Tufte gilt als Grand Seigneur der Datenvisualisierung; er hat mehrere lesenswerte Bücher zu dem Thema geschrieben. Auch Clevelands Ansichten sind weitflächig rezipiert worden (vgl. Cleveland (1993)).

  4. 4.

    Mit glimpse(movies).

  5. 5.

    1: year; 2: budget; 3: Punkte; 4: movies.

  6. 6.

    Achtung, man kann sich leicht vertippen: Nicht qqplot(), nicht ggplot2(), nicht gplot(), sondern qplot() ist der richtige Name des Befehls.

  7. 7.

    mosaic bietet auch Diagramme vom Typ lattice.

  8. 8.

    8 Variablen, alle numerisch.

  9. 9.

    mosaic::inspect(anscombe).

  10. 10.

    Für jede der relevanten Variablen kann ein Befehl dieser Art verwendet werden: mosaic::sd( ~ y1, data = anscombe).

  11. 11.

    mosaic::cor(x1 ~ y1, data = anscombe).

  12. 12.

    Die deskriptiven Statistiken für x bzw. y sind praktisch identisch zwischen den vier Teil-Datensätzen.

  13. 13.

    Zum Beispiel gf_abline(), gf_density(), gf_histogram(), gf_boxplot().

  14. 14.

    %>% gf_smooth(group = ~1).

  15. 15.

    Nein, die Glättungslinie ist eine Gerade bei mosaic.

  16. 16.

    gf_point(budget ~ year, data = movies).

  17. 17.

    gf_point(budget ~ year, data = movies) %>% gf_smooth().

  18. 18.

    Z. B. mit tally() oder count().

  19. 19.

    geom_point() wird verändert zu geom_point(alpha = 1/100).

  20. 20.

    aes(x = budget, y = rating) wird verändert zu aes(x = budget, y = rating, color = Jahrzehnt).

  21. 21.

    https://xkcd.com/1319/.

  22. 22.

    Wenn Sie niemanden finden, schicken Sie mir eine E-Mail.

  23. 23.

    Andere Geome, die in Frage kämen, sind Punkte, verwackelte Punkte (geom_jitter), Violinenplots oder Histogramme. Punkte als Geom haben das Problem, dass es zu Overplotting kommen kann. Violinen sind ähnlich wie Boxplots, aber noch informationsreicher. Histogramme sind weniger gut geeignet, um Gruppen zu vergleichen.

  24. 24.

    qplot(x = budget, geom = ″​histogram″​, data = movies, facets = ~factor(Jahrzehnt)).

  25. 25.

    Der Boxplot ist besser geeignet als das Histogramm, um mehrere Verteilungen vergleichend zu präsentieren. Durch die gleiche Ausrichtung der Boxplots fällt es dem Auge leichter, Vergleiche anzustellen im Vergleich zu den Histogrammen.

  26. 26.

    data(wo_men, package = ″​pradadata″​); qplot(x = shoe_size, data = wo_men, bins = 5); qplot(x = shoe_size, data = wo_men, bins = 50).

  27. 27.

    R, R, R, F, R, R, R, R, R, F.

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to Sebastian Sauer .

Rights and permissions

Reprints and permissions

Copyright information

© 2019 Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature

About this chapter

Check for updates. Verify currency and authenticity via CrossMark

Cite this chapter

Sauer, S. (2019). Datenvisualisierung mit ggplot2. In: Moderne Datenanalyse mit R. FOM-Edition. Springer Gabler, Wiesbaden. https://doi.org/10.1007/978-3-658-21587-3_11

Download citation

  • DOI: https://doi.org/10.1007/978-3-658-21587-3_11

  • Published:

  • Publisher Name: Springer Gabler, Wiesbaden

  • Print ISBN: 978-3-658-21586-6

  • Online ISBN: 978-3-658-21587-3

  • eBook Packages: Business and Economics (German Language)

Publish with us

Policies and ethics