FAIR forskningsdata

Er FAIR data bare en hype eller kan vi få det til i praksis?

FAIR-logo. Findable, Accessible, Interoperable, Reusable
FAIR-prinsippene, Findable, Accessible, Interoperable, Reusable.
By SangyaPundir - Own work, CC BY-SA 4.0, https://commons.wikimedia.org/w/index.php?curid=53414062

Helt siden en rekke forskere møttes i Leiden i 2014 og kom frem til FAIR-prinsippene har dette vært et "buzz word" innen åpen forskning. Forskningsdata skal være Findable, Accessible, Interoperable, Reusable, altså gjenfinnbare, tilgjengelige, interoperable og gjenbrukbare. Det betyr ikke at dataene nødvendigvis skal være åpent tilgjengelig, men metadataene til dataene må være åpne, slik at dataene i det minste er gjenfinnbare. 

Dette er enklere sagt enn gjort. Data blir bare mer og mer tilgjengelige, og det blir stadig lettere å samle inn mer data fra flere kilder på kortere tid. Du kan oppbevare større datasett og kjøre tyngre analyser. Men om du vil ha gode metadata knyttet til disse dataene og du vil at disse metadataene skal være tilgjengelige for andre, da har du en solid jobb å gjøre. IT-løsningene som skal hjelpe deg med dette finnes ikke ennå. 

Gartner hype cycle som viser en kurve som starter med en teknologi-trigger, øker til en topp av overdrevne forventninger, synker ned i en dal av desillusjon, stiger langs en stigning av opplysning og flater ut i et platå av produktivitet.Skriv inn bildetekst her...
Gartner hype cycle, der FAIR for øyeblikket kanskje nærmer seg toppen av overdrevne forventninger ("peak of inflated expectations"). Figur laget av Jeremykemp at English Wikipedia, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=10547051

 

Er FAIR forskningsdata bare en "hype" som aldri vil nå et såkalt platå av produktivitet? George Strawn [1] hevder at det første som må på plass for at forskning skal bli FAIR er nettopp de tekniske løsningene. Uten tekniske løsninger er det rett og slett for vanskelig å få til FAIR data og skikkelig åpen forskning. 

Dette jobber vi med her i TASK. Siden høsten 2020 har vi jobbet med å utvikle en teknisk løsning for å generere metadata for forskningsdata (filer, datasett, osv.), så automatisk som mulig. Målet er at forskerne og datarøkterne som bruker denne løsningen bare skal måtte oppgi et minimum av metadata manuelt, og alt annet som er tilgjengelig av informasjon om dataene fra andre digitale kilder skal kunne hentes automatisk og hektes på forskningsdataene. Det vil si at metadata om dataene generes automatisk og kan (hvis og bare hvis forskeren vil det) gjøres tilgjengelig på åpne nettsider. På den måten håper vi både at det skal bli lettere å holde orden på store datasett, og ikke minst lettere å gjøre forskningsdata FAIR. 

Du kan lese mer om prosjektet vi jobber med her.

[1] George Strawn; Open Science and the Hype Cycle. Data Intelligence 2021; 3 (1): 88–94. doi: https://doi.org/10.1162/dint_a_00081

Av Anne Schad Bergsaker
Publisert 26. nov. 2021 15:33 - Sist endret 13. des. 2021 09:07
sju mennesker

En blogg for deg som er interessert i IT-verktøy og datahåndtering, samt informasjon om, og erfaringer fra, forskningsprosjekter hvor bruk av IT inngår som en sentral del, enten det dreier seg om kvalitative eller kvantitative metoder/forskningsspørsmål.