Schaffe in kürzester Zeit den praktischen Einstieg in die deskriptive Statistik mit R
... und lerne, wie du mithilfe von der Programmiersprache R und den Grundlagen der deskriptiven Statistik Datensätze effizient analysieren und auswerten kannst.
Laufzeit des Kurses
ca. 10 Stunden
Benötigte Vorkenntnisse
Du benötigst keine Vorkenntnisse
Durch Big Data liegen in Unternehmen stetig anwachsende Datenmengen vor. Damit die Unternehmen von diesen ganzen Daten auch profitieren können, sind allerdings leistungsstarke Werkzeuge erforderlich, um diese Daten gewinnbringend auswerten zu können.
Genau hier kommt die Programmiersprache R zum Einsatz, denn dabei handelt es sich um eine der populärsten Programmiersprachen für statistische Auswertungen und Data Science.
In diesem Kurs werden wir uns deshalb die Grundlagen der deskriptiven Statistik in Kombination mit der Programmiersprache R ansehen.
Genauer gesagt wirst du lernen:
Wenn du also den Quereinstieg in die Programmierung planst, deine bereits bestehenden Programmierkenntnisse für einen neuen Job oder ein Jobinterview ausbauen möchtest oder dich einfach nur hobbymäßig mit der Analyse von Daten mithilfe statistischer Auswertungsmethoden befassen möchtest, dann ist dieser Kurs perfekt für dich geeignet.
Inhaltsverzeichnis des Kurses
In diesem Modul lernst du die Grundlagen der Programmiersprache R kennen. Wir installieren gemeinsam die Entwicklungsumgebung R Studio und verschaffen uns über diese einen Überblick. Zudem wirst du lernen, was Objekte sind und wie man Daten mithilfe von R einliest.
Diese Lektionen erwarten dich:
- [Video 1] Download und Installation von R Studio
- [Video 2] Rundgang in R Studio
- [Video 3] Objekte in R
- [Video 4] Daten einlesen in R
In diesem Modul erhältst du eine Einführung in die Grundlagen der Statistik. Du wirst lernen, was der Unterschied zwischen der deskriptiven und induktiven Statistik ist, wie die Datenerhebung erfolgt und was man unter dem Begriff Skalenniveaus versteht.
Diese Lektionen erwarten dich:
- [Video 1] Einführung in die Statistik
- [Video 2] Datenerhebung
- [Video 3] Skalenniveaus
- [Aufgabe] Programmieraufgabe + Musterlösung
In der Statistik gibt es zahlreiche Kennzahlen, die sehr wichtig für nahezu alle Analysen sind, wie beispielsweise die Mittelwertkennzahlen. In diesem Modul wirst du im Detail erfahren, welche Mittelwertkennzahlen es gibt und wie man diese in der Praxis verwendet.
Diese Lektionen erwarten dich:
- [Video 1] Einführung Mittelwerte
- [Video 2] Median/Modalwert
- [Video 3] Arithmetisches Mittel
- [Video 4] Arithmetisches und Geometrisches Mittel (Praxis)
- [Video 5] Median (Praxis)
- [Video 6] Modalwert (Praxis)
- [Video 7] Histogramm (Praxis)
- [Video 8] Code Histogramm und dplyr-Library
- [Aufgabe] Programmieraufgabe + Musterlösung
In diesem Modul widmen wir uns dem Thema Lageverteilung. Hier wirst du lernen, was es mit Quantilen, Perzentilen, Boxplots und vielem mehr auf sich hat.
Diese Lektionen erwarten dich:
- [Video 1] Quantile & Boxplots
- [Video 2] Quantile (Praxis)
- [Video 3] Skew und Kurtosis (Praxis)
- [Video 4] Perzentile (Praxis)
- [Video 5] Boxplots (Praxis)
- [Video 6] Datenklassierung (Praxis)
- [Video 7] Datenklassierung mit gleichgroßen Klassen (Praxis)
- [Aufgabe] Programmieraufgabe + Musterlösung
Eine weitere wichtige Kennzahlen Art sind die sogenannten Streuungskennzahlen. In diesem Modul wirst du deshalb lernen, was Streuungskennzahlen eigentlich sind, wie man die Abweichung vom Mittelwert berechnet, welche konkreten Streuungskennzahlen es überhaupt gibt und wie sich diese voneinander unterscheiden.
Diese Lektionen erwarten dich:
- [Video 1] Streuungskennzahlen Teil 1
- [Video 2] Streuungskennzahlen Teil 2
- [Video 3] Spannweite (Praxis)
- [Video 4] Lineare Streuung (Praxis)
- [Video 5] Varianz (Praxis)
- [Video 6] Variationskoeffizient (Praxis)
- [Aufgabe] Programmieraufgabe + Musterlösung
In diesem Modul beschäftigen wir uns mit der Outlier Detection. Du wirst also lernen, was ein sogenannter Ausreißer ist, womit sich die Anomalie-Detection beschäftigt, welche Verfahren es für die Erkennung von Ausreißern gibt und wann es überhaupt sinnvoll ist, Ausreißer aus einer Auswertung zu entfernen.
Diese Lektionen erwarten dich:
- [Video 1] Outlier Detection
- [Video 2] Outlier Detection Teil 1 (Praxis)
- [Video 3] Outlier Detection Teil 2 (Praxis)
- [Video 4] Outlier Detection Teil 3 (Praxis)
- [Aufgabe] Programmieraufgabe + Musterlösung
In diesem Modul wirst du lernen, wie wir mit Zweidimensionalen Maßzahlen umgehen können. Wir sehen uns also im Detail an, welche Zusammenhangsmaßkennzahlen es gibt und wie wir Zusammenhänge statistisch quantifizieren können.
Diese Lektionen erwarten dich:
- [Video 1] Zusammenhangsmaßkennzahlen
In diesem Modul sehen wir uns die einzelnen Zusammenhangsmaßzahlen detailliert an. Zudem wirst du lernen, was es mit dem Cramers V Maß auf sich hat.
Diese Lektionen erwarten dich:
- [Video 1] Häufigkeitstabelle
- [Video 2] Kontingenzkoeffizient
- [Video 3] Kreuztabelle (Praxis)
- [Video 4] Chi Quadrat (Praxis)
- [Video 5] Cramers V (Praxis)
- [Video 6] Kontingenzkoeffizient (Praxis)
- [Aufgabe] Programmieraufgabe + Musterlösung
In diesem Modul wirst du im Detail lernen, was es mit der Rangkorrelation auf sich hat.
Diese Lektionen erwarten dich:
- [Video 1] Rangkorrelation
- [Video 2] Rangkorrelation Teil 1 (Praxis)
- [Video 3] Rangkorrelation Teil 2 (Praxis)
- [Video 4] Jitter-Streudiagramm (Praxis)
- [Aufgabe] Programmieraufgabe + Musterlösung
In diesem Modul wirst du lernen, wie man Zusammenhänge von metrisch skalierten Variablen statistisch berechnen kann.
Diese Lektionen erwarten dich:
- [Video 1] Kovarianz/Korrelation
- [Video 2] Kovarianz (Praxis)
- [Video 3] Korrelation nach Pearson (Praxis)
- [Video 4] Visuelle Korrelation (Praxis)
- [Aufgabe] Programmieraufgabe + Musterlösung
In diesem Modul lernst du abschließend noch ein weiteres großes Feld der Statistik kennen, nämlich das Feld der sogenannten Zeitreihenanalyse. Du wirst lernen, was man unter einer Zeitreihenanalyse überhaupt versteht, was die wichtigsten Trendprognoseverfahren sind und wie es basierend auf diesen Verfahren möglich ist, zukünftige Werte statistisch zu prognostizieren.
Diese Lektionen erwarten dich:
- [Video 1] Einführung Zeitreihenanalysen
- [Video 2] Trendprognoseverfahren
- [Video 3] Fehlerberechnung
- [Video 4] Zeitreihenanalyse (Praxis)
- [Video 5] Prognoseverfahren (Praxis)
- [Video 6] Fehlerberechnung (Praxis)