Faktisk FAIR 

UiO og USIT oppfyller drømmen om data som svarer til FAIR-prinsippene; lagret slik at de er ekte gjenfinnbare og dermed også kan deles, etterprøves og gjenbrukes.

Enorme mengder data

Datamengden i forskningen øker stadig raskere. Mange forskningsprosjekter har hundretusenvis av datafiler med informasjon som både konklusjoner og videre forskning baserer seg på. Da sier det seg selv at det ikke er nok bare å kunne lagre filene - de må lagres på en slik måte at informasjonen kan bli funnet om den trengs ved en senere anledning Enten av prosjektet som samlet inn eller produserte dataene, eller av andre som skal etterprøve resultater, eller trenger dataene til videre forskning. På USIT blir det jobbet med nye løsninger for lagring og gjenfinning av data.

bilde av anne bergsaker
Senioringeniør Anne Schad Bergsaker er prosjektleder for prosjektet FAIR@uio.no (Foto: Joakim Magnus Taraldsen)

Nå blir det FAIR

– Helt siden jeg kom til USIT for 4 år siden, har det vært snakket om – og drømt om – faktisk FAIR data og løsningene som skal til for å gjøre data FAIR, sier Anne Schad Bergsaker. Bergsaker er senioringeniør på USIT og prosjektleder for det sentrale prosjektet FAIR@uio.

FAIR er et akronym som står for Findable, Accessible, Interoperable og Reusable. FAIR-prinsippene for forskningsdata ble formulert i 2016, og har blitt et internasjonalt anerkjent ideal. Forskningsdata må være tilgjengelige, gjenfinnbare og gjenbrukbare. Videre ligger det i begrepet "interoperable" at både data og metadata skal kunne håndteres maskinelt, og at tagging og metadata skal bruke konsistente vokabularer.

USIT og UiO er først ute

UiO, som først i Norge og helt i front i Europa og verden, innfører nå en plattform som gjør det mulig for forskerne å gjøre dataene faktisk FAIR. Andre lagrer kanskje forskningsdata samlet og sier at det er FAIR, men uten god tagging og gode metadata blir det ikke reelt gjenfinnbart når vi tenker over de fantastiske mengdene data det er der ute.

Prosjektleder Bergsaker fortsetter: – Når UiOs løsning for FAIR forskningsdata er i drift, er den ikke ment bare for UiOs forskere. Vi kan bli en viktig samarbeidspartner for både nasjonale og internasjonale prosjekter.

UiO og USIT tilbyr en rekke tjenester både innenfor og utenfor UH-sektoren. FAIR-løsningen blir en viktig del av denne porteføljen av tjenester som kan bestilles av interessenter utenfor UiO.

Stort potensial

Bergsaker forteller mer om prosjektet og plattformen: – Mange har nok ønsket seg en FAIRifier - et verktøy som gjør dataene FAIR. Der er vi nok ikke ennå, men vi nærmer oss. Plattformen vår blir IBM Elastic Storage Server ESS med programvaren IBM Spectrum Discover. Spectrum Discover bruker automatikk og skripting til å analysere filene og legge på riktige metadata. Det vil også være mulig for forskerne å legge inn ekstra informasjon om dataene sine manuelt, men målet er at så mye som mulig skal hentes inn automatisk. 

- Som flagship customer i IBM kan vi også være med på å påvirke hvordan løsningene skal videreutvikles, så dette er ordentlig spennende. Vi tenker at neste skritt kan være at analyseprosessen kan drives av AI, slik at den blir stadig mer automatisert og presis.

Serverløsningen på UiO kan i dag romme rundt 10 petabyte med data, men ved behov kan den utvides med mer enn 100 ganger dagens størrelse.

Sparer tid og ressurser i forskningen

Før videreutvikling og oppskalering må plattformen på plass og prøves ut. Nå er innføringsprosjektet i gang, og to forskningsprosjekter - DYNAKO ved Institutt for lærerutdanning og skoleforskning og VAVU ved RITMO på Institutt for musikkvitenskap.

– En løsning for FAIR forskningsdata er etterlengtet og etterspurt. FAIR blir nå satt som krav fra stadig flere av de som finansierer forskningsprosjekter. Når UiO nå kan tilby FAIR, blir vi en svært attraktiv samarbeidspartner, fortsetter Bergsaker.

Og nytten er åpenbar og udiskutabel. Når UiOs løsning er klar, vil den inneholde et åpent søk - ikke mot selve forskningsdataene, men mot informasjonen om dem. Slik kan forskere fra hele verden finne data som kan være til nytte i deres prosjekter, og etterspørre muligheten til å ta dem i bruk. På denne måten kan for eksempel norsk forskning på Covid-19 bli brukt videre i andre prosjekter. Når grunndata og andre forskningsdata kan brukes på nytt, sparer man både tid og andre ressurser.  

Publisert 12. feb. 2021 13:11 - Sist endret 12. feb. 2021 13:54