Zusammenfassung und Zeitplan
Dies ist ein Kurzüberblick über Datenverarbeitung mit
tidyverse in R.
Das Material eignet sich für R-Nutzer, die bereits Erfahrung mit R
haben und die tidyverse-Pakete kennenlernen möchten oder
ihr Wissen um diese vertiefen wollen.
Im Folgenden werden einige Möglichkeiten eingeführt, wie
Datenverarbeitung und -visualisierung mit R und dem
tidyverse Paketen durchgeführt werden können. Hierbei
werden grundlegende Kenntnisse von R vorausgesetzt.
Übersicht
Fragen
- Wie organisiere ich tabellarische Daten? (tibble)
- Wann sind Daten “tidy”?
- Wie importiere ich Daten? (readr,readxl, …)
- Wie transformiere ich Tabellen? (dplyr,tidyr)
- Wie baue ich Workflows mit pipes? (magrittr)
- Wie bearbeite ich Text? (stringr)
- Wie führe ich mehrere Datensätze zusammen? (dplyr)
- Wie visualisiere ich Daten? (ggplot2)
Ziele
- Überblick über die Möglichkeiten der Datenverarbeitung mit
tidyversePaketen
- Nachschlagewerk für die Verwendung von tidyverseFunktionen
Literatur
Als zusätzliche Lektüre und für einen detaillierten Einstieg im Selbststudium empfehlen wir das frei verfügbare Buch R for Data Science.
| Einrichtungshinweise | Lektionsdateien herunterladen | |
| Duration: 00h 00m | 1. Datenstrukturen | Welche “Datenarten” gibt es? Wie organisiere ich tabellarische Daten? Was ist “tidy”? | 
| Duration: 00h 20m | 2. Datenimport aus Dateien | Wie importiere ich Daten? ( readr,readxl,
…)Auf was muss ich achten? | 
| Duration: 00h 50m | 3. Datenverarbeitung | Wie baue ich komplexe Workflows mit pipes? Wie transformiere ich Tabellen? Wie bearbeite ich Text? Wie führe ich mehrere Datensätze zusammen? | 
| Duration: 01h 30m | 4. Visualisierung | Wie visualisiere ich Daten? | 
| Duration: 01h 55m | Fertig | 
Abhängig von den gewählten Themen und Übungen, kann der tatsächliche Zeitplan etwas abweichen.
Daten
Folgende Dateien werden in den Beispielen verwendet:
- storms-2019-2021.csv - deutsche CSV Datei
- storms-2019-2021.xlsx - Microsoft Excel Datei
Voraussetzungen
Folgende Installationen werden benötigt:
- R version 4.2.0 oder neuer
- 
tidyversepackages viainstall.packages(c("tidyverse", "readxl", "writexl"))- 
tibble- Cheatsheet - Tabellendatenstruktur
- 
magrittr- Cheatsheet - Pipe Operator%>%
- 
readr,readxl,writexl- Cheatsheet - Datenimport & -export
- 
dplyr- Cheatsheet - Datentransformation & -verarbeitung
- 
stringr- Cheatsheet - Textmanipulation
- 
tidyr- Cheatsheet - Datenbereinigung
- 
ggplot2- Cheatsheet - Visualisierung
 
- 
Alle Codebeispiele können in RStudio ausgeführt werden, wenn zuvor
tidyverse geladen wurde. Zum Beispiel via
library(tidyverse).