Steg 5: Beskrive
I dette steget skal dere beskrive datasettene med nødvendige metadata.
For at dere og andre skal vite hva som ligger i dataene og hvordan de kan brukes, må de være beskrevet med metadata. Det er en fordel om dere også beskriver begrepene som er knyttet til dataene. Noen datasett har dere kanskje gjort tilgjengelig fra før, for eksempel på egen nettside. Da er det lurt å beskrive hvordan andre får tilgang til disse dataene.
Når dere er ferdig med dette steget er følgende på plass:
- Dere har i tilstrekkelig grad beskrevet de kartlagte datasettene og dokumentert beskrivelsene i en oversikt.
Beskriv datasettene
Hva som tilsvarer «tilstrekkelig beskrevet», avhenger av virksomhetens mål med og behov for orden i eget hus. Dere må derfor selv vurdere hva slags informasjon om datasettene dere må samle inn og dokumentere i oversikten.
Som et minimum anbefaler vi at dere dokumenterer datasettets eier, tittel og tema, og tar med en beskrivelse av datasettets innhold. Hjemmelsgrunnlaget, som dere identifiserte i Steg 4: Vurdere tilgangsnivå, bør også tas med i datasettbeskrivelsen.
Andre aspekter ved datasettene som vil være nyttig å beskrive, er:
- Hvor dere finner datasettet (f.eks. navn på applikasjon, URL etc.)
- Hvorvidt datasettet er en autoritativ kilde (virksomheten samler inn dataene selv) eller en kopi (virksomheten henter dataene fra en annen virksomhet og lager evt. egen sammenstilling av dataene tilpasset eget bruk)
- Arbeidsprosessene og tjenestene (evt. livshendelsene) datasettet inngår i (dvs. blir skapt, brukt og oppdatert)
- Kvaliteten på datasettet (f.eks. beskrivelse av datasettets relevans, kompletthet, nøyaktighet og tilgjengelighet. Se "kvalitet på innhold"-feltet i Felles datakatalog for eksempler på kvalitetsbeskrivelser)
- Hvem som har ansvaret for datasettet, på laveste nivå (seksjon/avdeling eller person)
Beskriv teknisk tilgang til data som er tilgjengeliggjort
Har noen av datasettene dere har kartlagt, allerede blitt gjort tilgjengelige for gjenbruk og viderebruk? For eksempel på egen nettside eller i en sektorspesifikk dataportal? Da bør dere beskrive hvordan andre teknisk kan få tilgang til dem. Det kan enten være i form av nedlastbare filer i for eksempel CSV (omtalt som «distribusjoner») eller direkte oppslag (omtalt som «datatjenester»/«API-er»). Se Veileder for beskrivelse av datasett for hvordan distribusjoner og datatjenester beskrives. Dette krever teknisk kompetanse, og bør utføres av en utvikler.
Anbefaling: Beskriv de begrepene som er lettest å definere
Hvis dere i forrige steg kartla begreper, anbefaler vi at dere fortsetter ved å beskrive de begrepene som det er lettest å definere. Disse begrepene er gjerne definert i et lovverk. Som et minimum bør begrepets term og definisjon dokumenteres.
Se også i begrepskatalogen om andre allerede har definert begrepet og dere kan gjenbruke begrepsbeskrivelsen. Se også i nyttige ressurser og verktøy nederst på siden.
Gode begrepsbeskrivelser gjør at det tydelig fremgår hva dataene betyr slik at dere og andre skal forstå og bruke dataene riktig. Samtidig kan det være tidkrevende å beskrive enkelte begreper, og ofte må man involvere andre virksomheter som også benytter begrepet. Å ha beskrevet begreper er derfor ikke en forutsetning for det videre arbeidet med å skape oversikt over egne data.
Ytterligere anbefalinger
- Informasjonsmodeller: Dere kan gå grundigere til verks og i tillegg dokumentere dataene deres ved bruk av informasjonsmodeller. Dette vil bidra til effektiv informasjonsutveksling både internt og eksternt, og vil på sikt gjøre at dere og andre unngår store kostnader knyttet til integrasjoner.
Nyttige ressurser og verktøy
- For flere ideer til hva slags metadatafelter dere kan fylle ut for å beskrive datasettene, inkludert beskrivelse av kvalitet, se Veileder for beskrivelse av datasett.
- For veiledning til å beskrive begreper og ideer til hvilke metadatafelter dere kan fylle ut, se Veileder for begrepsbeskrivelser.
- Ønsker virksomheten din å gå videre med begrepsarbeid sammen med andre virksomheter, anbefaler vi at dere benytter Forvaltningsstandard for begrepsharmonisering og begrepsdifferensiering.
- Bruk gjerne Felles datakatalog til å dokumentere datasett- og begrepsbeskrivelsene. Husk at metadatafeltene i katalogene er begrenset til de standardene som ligger til grunn.