Hva er et datasett og hvilke datasett skal beskrives?
Et datasett er en organisert samling av data. Hvordan et datasett avgrenses og organiseres vil imidlertid variere mellom ulike virksomheter.
Det kan gjøres ulike valg f.eks. mht. hvilke datasett som skal spesifiseres i forbindelse med en saksbehandling eller trekkes ut av en database eller et register (se Brønnøysundregistrenes erfaringer med dette).
I ordforklaringene til “Standard for beskrivelse av datasett og datakataloger (DCAT-AP-NO)” brukes følgende definisjon: “Et datasett er en samling med data, for eksempel i form av en tabell, liste eller en database som kan gjøres tilgjengelig som en nedlastbar fil, og/eller nåes via et Web-API.”
Enn så lenge må vi overlate til den enkelte virksomhet å vurdere hva som er relevante samlinger av data (datasett) å beskrive for å senere publisere i egen sammenheng.
Det er i utgangspunktet opp til virksomheten, ut fra gitte formål, å definere hvilke datasett som er relevant å beskrive, og mange vil ha lovverk og retningslinjer som sier noe om dette. Imidlertid fokuserer veilederen på datadeling, dermed kan en grovt sett si at alle datasett som virksomheten kan dele med andre, er relevant å beskrive.
Å lage oversikt over og beskrive datasett vil ta tid, og det anbefales å starte i det små med datasett som en vet eller tror er etterspurt av andre. For noen vil det sannsynligvis være hensiktsmessig å ta for seg ulike arbeidsprosesser (f.eks. knyttet til forskjellige typer saksbehandling), og identifisere og beskrive datasett for én og én prosess. Dersom en har datasett som både brukes internt (av andre deler av virksomheten enn de som forvalter datasettene), og eksternt, bør en prioritere å starte med disse som vil gi gevinst for både egen og andre virksomheter.