Anbefalinger for god datakvalitet
Ansvar og plikter
Datatilbyder er ansvarlig for at sine autoritative data holder god datakvalitet. Som oftest blir dette plassert hos dataforvalter.
Hva er datakvalitet?
Datakvalitet handler om at dataene er til å stole på, og at de kan gjenbrukes av andre.
- At data er komplette
- At data er maskinlesbare
- At data er riktig formaterte
- At data er oppdatert
Hvorfor trengs god datakvalitet?
God datakvalitet gjør det enklere å gjenbruke dataene, som skaper mer effektiv datadeling.
Dårlig datakvalitet kan føre til:
-
Konsumenter slutter å bruke kildedataen, og en mister gevinstene med gjenbruk.
-
Konsumenter kan begynne å produsere egne data, eller "vaske" kildens data. I praksis har konsumenten innført et nytt kildesystem med tilnærmet like data. For institusjonen kan dette føre til ekstrakostnader og forvirring.
Hvordan sikre god datakvalitet?
Dataforvalter må:
- Være bevisst på sitt ansvar for datakvaliteten
- Evaluere sine data
- Ha rutiner for å sikre god datakvalitet
Konsumenter må:
-
Hente data fra det institusjonen har definert autoritativt kildesystem for dataene, og ikke via tredjeparter. Katalogtjenester, som AD og LDAP, er mulige å bruke så lenge de ikke har endret på de autoritative dataene.
-
Varsle/informere dataeier ved dårlig datakvalitet, for eksempel feil i data.