Alpha
Diese Lektion befindet sich in der Alpha-Phase, was bedeutet, dass sie bereits einmal unterrichtet wurde und die Autoren das Feedback einarbeiten.
Speichern sie Daten nur in Variablen zwischen, wenn sie diese Daten
mehrfach benötigen.
Verwenden sie Pipes (|>) um Daten durch eine Reihe
von Transformationen zu leiten.
Versuchen sie die Datenverarbeitung in kleine, leicht verständliche
Schritte zu unterteilen.
Vermeiden sie unnötige Schleifen und Schachtelungen, das meiste
lässt sich mit Grouping, vektorisierten Operationen und Joins kompakter
und eleganter lösen.
Auch explizite Elementzugriffe (z.B. df$col) und
-operationen können i.d.R. effizient durch dplyr Funktionen
ersetzt werden.
ggplot2 benötigt einen data.frame als
Eingabe, welcher “tidy” ist (d.h. eine Zeile pro Beobachtung und eine
Spalte pro Variable).
Das mapping Argument ermöglicht mittels der
aes() Funktion die Verknüpfung von Variablen des
Datensatzes (d.h. Spaltennamen) mit visuellen Eigenschaften (z.B.
x-Achse, Farbe, Größe).
labs() ermöglicht die Anpassung von Diagrammtitel und
Achsenbeschriftung.
theme_* Funktionen ermöglichen die Anpassung genereller
Diagrammformatierungen (z.B. Hintergrundfarben, Schriftarten).
Es gibt viele weitere Funktionen und Argumente, um die Darstellung
von Diagrammen zu verfeinern (z.B. facet_wrap(),
scale_*, coord_*).
Diagramme mit ggsave() in beliebigem Dateiformat (PNG,
PDF, SVG, ..) speichern.
Ausserdem gibt es viele Erweiterungen für ggplot2 (z.B.
ggplotly, ggrepel), die zusätzliche
Funktionalitäten oder Visualisierungstypen/-diagramme bieten.