DieSachsen.de

Statistik-Blog: Dresden, Sachsen & mehr

Hilfe erstellen für Funktionen in eigenen R-Paketen (roxygen2)

28.03.2020 von Wolf Riepl, Social Science Research, Einzelunternehmen

Nachdem wir in früheren Beiträgen gesehen haben, warum und wann es überhaupt sinnvoll ist, eigene R-Pakete zu erstellen und wie man ein erstes Paket in zwei Minuten erstellen kann, wollen wir uns heute mit einem wesentlichen Aspekt von R-Paketen näher beschäftigen: Der Dokumentat .. lesen

Statistik-Blog: Dresden, Sachsen & mehr

Ein eigenes R-Paket in zwei Minuten erstellen mit RStudio

23.03.2020 von Wolf Riepl, Social Science Research, Einzelunternehmen

Dank der Unterstützung durch RStudio (die kostenlose Desktop-Version reicht vollkommen aus) kann man in wenigen Minuten ein eigenes R-Paket erstellen. Dieser Beitrag ist die Fortsetzung zu: Eigene R-Pakete erstellen: Warum und wann? R-Paket als RStudio-Projekt RStudio bietet die .. lesen

Statistik-Blog: Dresden, Sachsen & mehr

Eigene R-Pakete erstellen: Warum und wann?

17.01.2020 von Wolf Riepl, Social Science Research, Einzelunternehmen

Warum und wann ist es sinnvoll, eigene R-Pakete zu erstellen? Dieser Beitrag richtet sich an R-Anwender, die regelmäßig R-Code schreiben (oder vorhandenen Code anpassen), vielleicht auch schon eigene Funktionen geschrieben haben – aber es bisher nicht als ihre Aufgabe gesehen hab .. lesen

Statistik-Blog: Dresden, Sachsen & mehr

Der Ratingscore – Eine statistische Analyse von Bewertungskennzahlen

20.12.2019 von Wolf Riepl, Social Science Research, Einzelunternehmen

Gastbeitrag von Tim Scheffczyk Zusammenfassung Digitale Marktplätze dienen ebenso wie klassische Handelsplätze dazu, Angebot und Nachfrage zu koordinieren. Charakteristisch für beide Marktformen ist das Vorliegen asymmetrischer Informationsverteilung zwischen den Verkäufern und p .. lesen

Statistik-Blog: Dresden, Sachsen & mehr

ASUM-DM: Ein Standard-Prozessmodell für Data Mining und Predictive Analytics

21.10.2019 von Wolf Riepl, Social Science Research, Einzelunternehmen

2015 veröffentlichte IBM eine Überarbeitung und Erweiterung von CRISP-DM (CRoss-Industry Standard Process for Data Mining). Der neue Standard nennt sich ASUM-DM, in Langform: Analytics Solutions Unified Method for Data Mining/Predictive Analytics. ASUM-DM: Versionen und Ziele Von .. lesen

Statistik-Blog: Dresden, Sachsen & mehr

Data Mining mit R: Zusammenhänge erkennen, Zielgruppen finden

03.10.2019 von Wolf Riepl, Social Science Research, Einzelunternehmen

Beim Data Mining geht es darum, Erkenntnisse aus vorhandenen Daten zu gewinnen – im Gegensatz zum Machine Learning, das darauf abzielt, zuvor traininerte Modelle auf neue Daten anzuwenden. TL; DR: Kurze Zusammenfassung Entscheidungsbäume sind ein mächtiges Werkzeug für Data Minin .. lesen

Statistik-Blog: Dresden, Sachsen & mehr

R für Umsteiger von Excel und SPSS: Automatisierte Berichte

28.09.2019 von Wolf Riepl, Social Science Research, Einzelunternehmen

In den letzten Jahren wurden mehrfach Artikel publiziert, die auf ein gravierendes Problem hinwiesen: Schätzungen zufolge sind deutlich mehr als die Hälfte der prä-klinischen Studienergebnisse nicht reproduzierbar. Wissenschaftliche Studienergebnisse oft nicht reproduzierbar So t .. lesen

Statistik-Blog: Dresden, Sachsen & mehr

R-Programmierung: Was ist %>% ? dplyr vs. Base R

11.09.2019 von Wolf Riepl, Social Science Research, Einzelunternehmen

Was bedeutet die sonderbar anmutende Zeichenkombination %>% , die man seit ein paar Jahren häufig in R-Skripten findet? Woher kommt sie und wie können wir sie nutzen, um eleganteren und besser lesbaren R-Code zu schreiben? R und moderne Kunst: René Magritte R inspiriert uns mit % .. lesen

Statistik-Blog: Dresden, Sachsen & mehr

Storytelling mit R und ggplot2: Länderfinanzausgleich

28.08.2019 von Wolf Riepl, Social Science Research, Einzelunternehmen

ggplot2 ist ein mächtiges Werkzeug, um ansprechende Grafiken zu erstellen. Will man Zuhörer oder Leser „mitnehmen“, empfiehlt es sich, nicht nur Daten zu präsentieren, sondern auch eine Geschichte damit zu erzählen. Unser Storytelling-Beispiel bezieht sich auf den Länderfinanzaus .. lesen

Statistik-Blog: Dresden, Sachsen & mehr

Elegante R-Programmierung mit purrr::map und genisteten Datensätzen

27.05.2019 von Wolf Riepl, Social Science Research, Einzelunternehmen

2016 machte Hadley Wickham eine Idee populär, von der er zunächst selbst nicht sicher war, ob sie gut ist: genistete Datensätze (nested data frames). Das Prinzip ist einfach: Eine Spalte eines Datensatzes kann selbst ein Datensatz sein. Was zunächst umständlich oder verwirrend kl .. lesen

Laden...