DieSachsen.de

Statistik-Blog: Dresden, Sachsen & mehr

Daten mit R in Blöcken verarbeiten mit iotools: Big Data-Werkzeug

19.11.2020 von Wolf Riepl, Social Science Research, Einzelunternehmen

Beim Verarbeiten großen Datenmengen mit R kann man an Grenzen des Arbeitsspeichers stoßen. In R kann das früher geschehen, als man meinen möchte. Wer beispielsweise über 16 GB RAM verfügt und einen 10 GB-Datensatz analysieren möchte, wird feststellen, dass R bei bestimmten Operat .. lesen

Statistik-Blog: Dresden, Sachsen & mehr

Der GOAT-Score. Eine statistische Betrachtung der Grand Slams

02.11.2020 von Wolf Riepl, Social Science Research, Einzelunternehmen

Rafael Nadal bezwingt Novak Djokovic und gewinnt zum 13. Mal die French Open und schliesst damit mit seinem 20. Grand-Slam-Titel nach Anzahl an Grand-Slam-Siegen zu Roger Federer auf. Alle drei genannten gelten als die grössten Tennisspieler aller Zeiten und werden als «The Big T .. lesen

Statistik-Blog: Dresden, Sachsen & mehr

data.table vs. dplyr und dtplyr: Benchmarks

27.07.2020 von Wolf Riepl, Social Science Research, Einzelunternehmen

Zwei der populärsten Pakete zur Datenaufbereitung in R sind data.table (Matt Dowle, Arun Srinivasan, viele Mitarbeiter) und dplyr (Hadley Wickham, viele Mitarbeiter). Während data.table zu Recht den Ruf hat, sehr schnell zu sein, hat dplyr vielen den Einstieg in R enorm erleichte .. lesen

Statistik-Blog: Dresden, Sachsen & mehr

Gastbeitrag: Die faire Abschlusstabelle der Bundesligasaison 2019/20

14.05.2020 von Wolf Riepl, Social Science Research, Einzelunternehmen

Abstract Aufgrund der aktuellen Coronakrise stehen die Sportverbände sämtlicher Sportarten vor der Frage, ob die laufende Saison 2019/20 noch zu Ende gespielt werden kann. Einige Sportverbände wie beispielsweise der Handball haben sich bereits für einen Abbruch der Saison entschi .. lesen

Statistik-Blog: Dresden, Sachsen & mehr

Textantworten (offene Nennungen) automatisch zuordnen in R nach Ähnlichkeit

22.04.2020 von Wolf Riepl, Social Science Research, Einzelunternehmen

Wie kann man Textantworten automatisch in R codieren, wenn es viele ähnliche, aber nicht exakt gleiche Einträge gibt? Mit dem R-Paket tidystringdist! The post Textantworten (offene Nennungen) automatisch zuordnen in R nach Ähnlichkeit first appeared on Statistik Dresden. lesen

Statistik-Blog: Dresden, Sachsen & mehr

Textantworten (offene Nennungen) codieren mit R: stringr und regex

21.04.2020 von Wolf Riepl, Social Science Research, Einzelunternehmen

Oft wird ein großer Teil der Projektzeit nicht für die spannenden Modelle, sondern für die meist etwas weniger spannend empfundene Datenaufbereitung verwendet. Ein typischer Stolperstein dabei ist die Codierung von Textantworten (offene Nennungen). Wie können wir uns diese Arbeit .. lesen

Statistik-Blog: Dresden, Sachsen & mehr

Große Datenmengen visualisieren mit R, ggplot2 und trelliscopejs

17.04.2020 von Wolf Riepl, Social Science Research, Einzelunternehmen

Wie kann man große Datenmengen in R so darstellen, dass sie gut lesbar sind und viele Informationen preisgeben? „Große Datenmengen“ verstehen wir hier im Sinne von „viele Untergruppen“, nicht unbedingt im Sinne von vielen Gigabyte. Wer versiert ist, denkt vielleicht an eine Shiny .. lesen

Statistik-Blog: Dresden, Sachsen & mehr

Hilfe erstellen für Funktionen in eigenen R-Paketen (roxygen2)

28.03.2020 von Wolf Riepl, Social Science Research, Einzelunternehmen

Nachdem wir in früheren Beiträgen gesehen haben, warum und wann es überhaupt sinnvoll ist, eigene R-Pakete zu erstellen und wie man ein erstes Paket in zwei Minuten erstellen kann, wollen wir uns heute mit einem wesentlichen Aspekt von R-Paketen näher beschäftigen: Der Dokumentat .. lesen

Statistik-Blog: Dresden, Sachsen & mehr

Ein eigenes R-Paket in zwei Minuten erstellen mit RStudio

23.03.2020 von Wolf Riepl, Social Science Research, Einzelunternehmen

Dank der Unterstützung durch RStudio (die kostenlose Desktop-Version reicht vollkommen aus) kann man in wenigen Minuten ein eigenes R-Paket erstellen. Dieser Beitrag ist die Fortsetzung zu: Eigene R-Pakete erstellen: Warum und wann? R-Paket als RStudio-Projekt RStudio bietet die .. lesen

Statistik-Blog: Dresden, Sachsen & mehr

Eigene R-Pakete erstellen: Warum und wann?

17.01.2020 von Wolf Riepl, Social Science Research, Einzelunternehmen

Warum und wann ist es sinnvoll, eigene R-Pakete zu erstellen? Dieser Beitrag richtet sich an R-Anwender, die regelmäßig R-Code schreiben (oder vorhandenen Code anpassen), vielleicht auch schon eigene Funktionen geschrieben haben – aber es bisher nicht als ihre Aufgabe gesehen hab .. lesen

Laden...