DieSachsen.de

Statistik-Blog: Dresden, Sachsen & mehr

Eigene R-Pakete erstellen: Warum und wann?

17.01.2020 von Wolf Riepl, Social Science Research, Einzelunternehmen

Warum und wann ist es sinnvoll, eigene R-Pakete zu erstellen? Dieser Beitrag richtet sich an R-Anwender, die regelmäßig R-Code schreiben (oder vorhandenen Code anpassen), vielleicht auch schon eigene Funktionen geschrieben haben – aber es bisher nicht als ihre Aufgabe gesehen hab .. lesen

Statistik-Blog: Dresden, Sachsen & mehr

Der Ratingscore – Eine statistische Analyse von Bewertungskennzahlen

20.12.2019 von Wolf Riepl, Social Science Research, Einzelunternehmen

Gastbeitrag von Tim Scheffczyk Zusammenfassung Digitale Marktplätze dienen ebenso wie klassische Handelsplätze dazu, Angebot und Nachfrage zu koordinieren. Charakteristisch für beide Marktformen ist das Vorliegen asymmetrischer Informationsverteilung zwischen den Verkäufern und p .. lesen

Statistik-Blog: Dresden, Sachsen & mehr

ASUM-DM: Ein Standard-Prozessmodell für Data Mining und Predictive Analytics

21.10.2019 von Wolf Riepl, Social Science Research, Einzelunternehmen

2015 veröffentlichte IBM eine Überarbeitung und Erweiterung von CRISP-DM (CRoss-Industry Standard Process for Data Mining). Der neue Standard nennt sich ASUM-DM, in Langform: Analytics Solutions Unified Method for Data Mining/Predictive Analytics. ASUM-DM: Versionen und Ziele Von .. lesen

Statistik-Blog: Dresden, Sachsen & mehr

Data Mining mit R: Zusammenhänge erkennen, Zielgruppen finden

03.10.2019 von Wolf Riepl, Social Science Research, Einzelunternehmen

Beim Data Mining geht es darum, Erkenntnisse aus vorhandenen Daten zu gewinnen – im Gegensatz zum Machine Learning, das darauf abzielt, zuvor traininerte Modelle auf neue Daten anzuwenden. TL; DR: Kurze Zusammenfassung Entscheidungsbäume sind ein mächtiges Werkzeug für Data Minin .. lesen

Statistik-Blog: Dresden, Sachsen & mehr

R für Umsteiger von Excel und SPSS: Automatisierte Berichte

28.09.2019 von Wolf Riepl, Social Science Research, Einzelunternehmen

In den letzten Jahren wurden mehrfach Artikel publiziert, die auf ein gravierendes Problem hinwiesen: Schätzungen zufolge sind deutlich mehr als die Hälfte der prä-klinischen Studienergebnisse nicht reproduzierbar. Wissenschaftliche Studienergebnisse oft nicht reproduzierbar So t .. lesen

Statistik-Blog: Dresden, Sachsen & mehr

R-Programmierung: Was ist %>% ? dplyr vs. Base R

11.09.2019 von Wolf Riepl, Social Science Research, Einzelunternehmen

Was bedeutet die sonderbar anmutende Zeichenkombination %>% , die man seit ein paar Jahren häufig in R-Skripten findet? Woher kommt sie und wie können wir sie nutzen, um eleganteren und besser lesbaren R-Code zu schreiben? R und moderne Kunst: René Magritte R inspiriert uns mit % .. lesen

Statistik-Blog: Dresden, Sachsen & mehr

Storytelling mit R und ggplot2: Länderfinanzausgleich

28.08.2019 von Wolf Riepl, Social Science Research, Einzelunternehmen

ggplot2 ist ein mächtiges Werkzeug, um ansprechende Grafiken zu erstellen. Will man Zuhörer oder Leser „mitnehmen“, empfiehlt es sich, nicht nur Daten zu präsentieren, sondern auch eine Geschichte damit zu erzählen. Unser Storytelling-Beispiel bezieht sich auf den Länderfinanzaus .. lesen

Statistik-Blog: Dresden, Sachsen & mehr

Elegante R-Programmierung mit purrr::map und genisteten Datensätzen

27.05.2019 von Wolf Riepl, Social Science Research, Einzelunternehmen

2016 machte Hadley Wickham eine Idee populär, von der er zunächst selbst nicht sicher war, ob sie gut ist: genistete Datensätze (nested data frames). Das Prinzip ist einfach: Eine Spalte eines Datensatzes kann selbst ein Datensatz sein. Was zunächst umständlich oder verwirrend kl .. lesen

Statistik-Blog: Dresden, Sachsen & mehr

Länderfinanzausgleich: 30 Jahre in einer animierten Grafik (1988 – 2018)

22.04.2019 von Wolf Riepl, Social Science Research, Einzelunternehmen

Wie kann man die Beträge, die die Bundesländer im Rahmen des Länderfinanzausgleichs zahlten oder erhielten, in einer Grafik darstellen, sodass Veränderungen im Zeitverlauf deutlich werden? Hier eine animierte Grafik, die den Zeitraum von 1988, also kurz vor der Wende, bis 2018 ab .. lesen

Statistik-Blog: Dresden, Sachsen & mehr

R-Code beschleunigen: Schleifen vs. Vektorisierung vs. Lookup-Tables

26.03.2019 von Wolf Riepl, Social Science Research, Einzelunternehmen

Kurzfassung:R erlaubt dem Anwender, vergleichsweise schnell Analysecode zu schreiben, da die formalen Anforderungen gering sind. Dafür gilt R nicht zu unrecht als vergleichsweise langsam hinsichtlich der Code-Laufzeit. Wir vergleichen drei Varianten, einem Datensatz mit Skat-Kart .. lesen

Laden...