Definitie dataset en databron

De termen "dataset" en "databron" worden op data.overheid.nl gebruikt om een verzameling van data aan te duiden. Er bestaat geen vastgestelde definitie van deze begrippen. Onderstaande definitie is zoals data.overheid.nl deze hanteert. 

  • Dataset: een beschrijving van een verzameling van data van een data-eigenaar. Dit kan bijvoorbeeld één tabel met data zijn of een verzameling van tabellen met samenhangende data, bijvoorbeeld alle tabellen per jaar over de periode 2005-2016.  
  • Databron: een verwijzing naar de daadwerkelijke vindplaats van data die in de dataset wordt benoemd. Een dataset bevat één of meer databronnen. In het voorbeeld is er één databron in de vorm van één tabel met data of meerdere  databronnen overeenkomend met het aantal tabellen per jaar.   

Hierbij gelden de volgende vuistregels: 

  • Een dataset wordt gevormd door een beschrijving en metadata. Er zijn een aantal verplichte velden (afgedwongen door de DCAT standaard) en optionele velden. De dataset beschrijft de inhoud van de onderliggende databronnen.
  • Een dataset wordt door de data-eigenaar zo samengesteld dat de optimale samenstelling van beschrijving en databronnen biedt voor hergebruik. De data-eigenaar bepaalt. 
  • Een dataset bevat tenminste één databron en mogelijk meer databronnen. Een databron kan voorkomen in meerdere datasets indien de data-eigenaar dit handig vindt om hergebruik te stimuleren. Het dubbel verwijzen naar dezelfde databronnen moet zoveel mogelijk worden voorkomen en alleen worden gebruikt als dit niet anders kan.