Rapportutforming med R i TSD

Hva er sammenhengen mellom nettskjema.uio.no, TSD,
rapporter og R?

TSD-logo

I det siste har flere forskningsgrupper etterspurt å få utviklet rapporter basert på data lagret i "Tjenester for Sensitive Data" (TSD)[1], ofte samlet inn via nettskjema.uio.no. Disse rapportene er som regel enten (a) aggregerte data basert på grupperinger av individer eller (b) bearbeidete data på individ-nivå. Dekrypterte rådata fra nettskjema.uio.no lagres ofte som CSV-filer (CSV = "comma-separated values").

Eksempel på data i csv-format
Eksempel på data i csv-format

 

R

R er kanskje mest kjent som en programvare for statistiske beregninger og datavisualisering, men er også et fullverdig programmeringsspråk på linje med f.eks. Python. R har mange innebygde og eksterne funksjoner for å behandle ulike datastrukturer, men særlig datastrukturer på tabulær form, gjerne da  hentet fra CSV-filer. Eksempelvis kan figurer og tabeller lages med henholdsvis R-pakkene "ggplot2" og "gt". Men hvordan knytte disse prosessene til rapportutforming?

 

R-logo
Hadley Wickham and others at RStudio, CC BY-SA 4.0 <https://creativecommons.org/licenses/by-sa/4.0>, via Wikimedia Commons

 

Rmarkdown

Rmarkdown er en "pakke" integrert med Rstudio[2], som gjør det mulig å kombinere både R-kode for databehandling, med Rmarkdown-kode for utvikling av reproduserbare dokumenter. Rmarkdown støtter en rekke statiske og dynamiske formater, inkludert HTML, PDF, "dashboard"[3], MS Word, mfl. Til en viss grad kan Rmarkdown flettes sammen med kode fra HTML, CSS, JavaScript og LaTeX (avhengig av filtype), som gir flere muligheter i rapportuforming. Disse ulike prosessene kan samkjøres og automatiseres, slik at nye rapporter genereres når nye data er tilgjengelige. TASK-teamet benytter R og Rmarkdown i bl.a. prosjektene DIGIKOST, Olweus, og for forskningsgruppen CanCell.

Ta gjerne kontakt med oss i TASK-teamet dersom det er ønskelig å bruke R og Rmarkdown for rapportutforming basert på data i eller utenfor TSD.

 

[1] TSD er en plattform for å lagre og jobbe med sensitive data (alt fra “grønne” til “svarte” data). Klikk her for mer info
[2] Rstudio er et brukergrensesnitt for R
[3] Dashboard i R kan lages med Rshiny 

Av Luigi Maglanoc
Publisert 16. des. 2021 11:47 - Sist endret 16. des. 2021 11:47
sju mennesker

En blogg for deg som er interessert i IT-verktøy og datahåndtering, samt informasjon om, og erfaringer fra, forskningsprosjekter hvor bruk av IT inngår som en sentral del, enten det dreier seg om kvalitative eller kvantitative metoder/forskningsspørsmål.