Dataformaten

Data formaten voor een dataset

Bij het aanmelden van een dataset op data.overheid.nl kun je databronnen toevoegen in verschillende formaten. Voor elke databron die je toevoegt aan een dataset, zijn twee kenmerken verplicht om op te geven: het soort distributie en het type van het bestand.

Soort distributie

Je kiest bij het aanmelden van een databron eerst het soort distributie dat je toevoegt. Dit heet het "distributietype" en is het eerste veld om in te voeren voor een databron. Je kunt de volgende opties kiezen:

  • een downloadbaar bestand (via een link of direct uploaden van bestand),
  • een webservice (link naar een API of vergelijkbaar),
  • een visualisatie (link of upload van bijvoorbeeld een LocalFocus grafiek),
  • een data schema (link naar een beschrijving van het datamodel of kolombeschrijvingen)
  • documentatie (link of upload van een document) 

 Onderstaande schermprint uit het aanmeldformulier toont de selectie mogelijkheid. De formaten zijn opgenomen in de DCAT waardelijsten onder DONL:DistributionType (JSON versie)

Bestandstype

In de volgende stap kies je het bestandstype van de databron die je toevoegt. Het bestandstype is een lange lijst van mogelijke formaten die een distributie kan hebben. In het aanmeld formulier ziet de selectie van het bestandstype er zo uit: 

bestandstype selecteren

 

Open Data bestandformaten

De belangrijkste formaten zijn in onderstaande tabel opgenomen.

FORMAAT Uitleg
Atom  Op XML gebaseerd dataformaat dat vergelijkbaar is met .rss. Het is ontworpen als universele standaard voor persoonlijke content en weblogs.
JSON Dit standaard formaat wordt gebruikt voor het opslaan van eenvoudige data en objecten. De tekst is te lezen voor mensen en is gebaseerd op javascript.
OGC: WMS WMS wordt gebruikt in veel GEO datasets. Het bevragen van een webservice formaat kan tot problemen leiden in de webbrowser. Een hulptool zoals ArcGis of QGis is daarom raadzaam bij het openen van de data.
OGC: WFS WFS wordt gebruikt in veel GEO datasets. Het bevragen van een webservice formaat kan tot problemen leiden in de webbrowser. Een hulptool zoals ArcGis of QGis is daarom raadzaam bij het openen van de data.
GML Geography Markup Language (GML) is het uitwisselingsformaat voor geografische bestanden. Het definieert XML-codering voor het overbrengen en opslaan van allerlei geo-informatie, zoals geometrie, topografie, coverages en sensordata. GML kan worden gebruikt voor bestandsuitwisseling, maar ook binnen webservices zoals WFS.
KML Keyhole Markup Language (KML) is een op XML gebaseerde, standaard opmaaktaal voor geografische data. Het is erkend als ISO-standaard en wordt veelal in combinatie met Google Maps gebruikt.
TXT TXT formaten zijn tekstformaten en zijn bedoeld om tekstuele data uit te wisselen.
ZIP Een ZIP is een map met daarin meerdere documenten.
CSV Comma Separated Values (CSV) is een databestand met data die gescheiden wordt door komma's. CSV wordt vaak gebruikt om gegevens uit te wisselen.
HTML HTML is een webpagina die weergegeven wordt in een webbrowser. De HTML-broncode wordt ontleed door de webbrowser en wordt meestal niet gezien door de gebruiker.
XML  XML is een gegevensbestand dat labels gebruikt om objecten en objectkenmerken te definiëren; het wordt geformatteerd net als een HTML. XML bestanden zijn een standaard manier van opslag en overdracht van gegevens tussen programma en via het internet. Omdat ze zijn opgemaakt als tekstdocumenten kunnen ze worden bewerkt door een eenvoudige tekstverwerker.

 

Andere toegestane bestandsformaten

Naast de formaten in bovenstaande tabel staat data.overheid.nl ook andere bestandsformaten toe. Deze formaten zijn geen "open" formaten, maar worden veel gebruikt om data te delen. Wij adviseren om altijd een open bestandsformaat beschikbaar te stellen, naast een niet open formaat. De volledige lijst van bestandsformaten vindt je in het DCAT waardelijst overzicht onder MDR:filetype (JSON versie).

Een voorbeeld van een niet open formaat is de SHAPE-file. De SHAPE-file is formeel geen open data formaat. Maar er is voor gekozen om dit formaat als open data te zien, omdat het formaat veel wordt gebruikt door overheidsorganisaties. 

De lijst met alle formaten die zijn toegestaan om in te voeren op data.overheid.nl vind je hier: