Anbefalinger for god datakvalitet

Ansvar og plikter

Det er dataeier som er ansvarlig for at sine autoritative data holder god datakvalitet.

Hva er datakvalitet?

Datakvalitet handler om at dataene er til å stole på, og at de kan gjenbrukes av andre.

  • At data er komplette
  • At data er maskinlesbare
  • At data er riktig formaterte
  • At data er oppdatert

Hvorfor trengs god datakvalitet?

God datakvalitet gjør det enklere å gjenbruke dataene, som skaper mer effektiv datadeling.

En erfaring er at dårlig datakvalitet kan føre til at andre tjenester enten begynner å produsere sine egne data, eller gjennomfører "vask" av autoritative data. I praksis fører dette til at institusjonen ender opp med to autoritative kildesystemer med tilnærmet samme data, som er både forvirrende og lite kostnadseffektivt.

Hvordan siker god datakvalitet?

Dataeier må:

  • Være bevisst på sitt ansvar for datakvaliteten
  • Evaluere sine data
  • Ha rutiner for å sikre god datakvalitet

Konsumenter må:

  • Hente data fra det som er autoritativt kildesystem for dataene, og ikke via tredjeparter som eventuelt har endret på data.
    • Oppslagstjenester og kataloger, som AD og LDAP, er her innenfor, så lenge de ikke endrer på de autoritative dataene.
  • Varsle/informere dataeier ved dårlig datakvalitet. TBD: Evt. eskalere internt ved behov?

TBD: Noko frå referansearkitekturen her? Lenke til orden i eget hus og anna?

Publisert 15. jan. 2021 12:37 - Sist endret 15. jan. 2021 12:45