Stap 3c: Schep de infrastructuur

Gelijktijdig met of aansluitend op het organiseren en plannen van het Open data proces, moet ook de benodigde infrastructuur worden geschapen. Deze infrastructuur bestaat uit een puur technisch gedeelte maar ook uit een zachter 'informationeel gedeelte'.

Technische infrastructuur

Goed beschouwd moeten de data die Open Data moeten worden van A naar B. Ze zitten in A - back-office systemen van de organisatie - en ze moeten naar B - een voor Open Data bedoeld datamagazijn binnen het netwerk. Dikwijls worden hiervoor scripts gebruikt - zogenaamde ETL-scripts (staat voor Extract Transform Load) waarmee de data in de gewilde vorm worden getransformeerd en op een op de doellocatie geladen. Dit heeft tot voordeel dat systemen niet aangepast hoeven worden.
Vanuit dit datamagazijn worden vervolgens de databestanden periodiek op een dataserver in een zogenaamde DMZ (demilitarized zone) geladen, die overigens ook prima extern gehost kan worden. Dit gebeurt uitsluitend geïnitieerd vanuit het netwerk, en betreft eenrichtingsverkeer naar de DMZ toe. Het is vervolgens deze dataserver die via het web te benaderen is door hergebruikers om Open Data te bekijken en op te halen.

Dan wil je een plek creëren waar de Open Data via een eigen herkenbaar kanaal naar buiten kunnen. De website van de organisatie ligt voor de hand, maar er zijn ook andere opties (verzamelsites, samenwerking met nabij gelegen organisaties die al aan Open Data doen). Uiteraard spelen ook de beschikbare middelen hierbij een rol. De twee meest gangbare opties zijn een zogenoemde datadump of ontsluiting via een API. Een datadump houdt in dat de gehele dataset in een keer geplaatst wordt. Een API staat voor Application Programming Interface, wat betekent dat je als gebruiker, als het ware, vragen kunt stellen aan de dataset. Deze laatste optie wordt vooral gehanteerd wanneer het grote en gecompliceerde datasets betreft. Realiseer je wel dat het maken van een API een behoorlijke klus kan zijn en bovendien kun je je afvragen of dat nog wel een taak is van je organisatie (en niet van de markt).

Waar je ook voor kiest, het is raadzaam simpel en klein te beginnen: een eenvoudige (sub)site waar de datasets thematisch en/of in alfabetische volgorde kunnen worden gevonden en downloadbaar zijn in de meest gangbare formaten. Uiteraard kunnen de functionaliteiten gaandeweg uitgebreid worden.

Wordt er realtime data of met regelmaat wisselende data ontsloten, dan zijn er verschillende mogelijkheden om deze data te ontsluiten:

  • een webservice die gestructureerde data onsluit
  • basisdatabestand met een incrementeel wijzigingsbestand erbij
  • wijzigingsbestanden

Voor welke manier van beschikbaar stellen een overheidsorganisatie kiest is afhankelijk van de mogelijkheden en de vorm waarin de data geleverd kan worden. Uitgangspunt is in ieder geval dat er een open standaard, zonder beperkingen in hergebruik wordt toegepast.

Informationele infrastructuur

Daarnaast wil je natuurlijk ook op de plek waar je de data publiceert een aantal zaken helder maken. Denk hierbij aan:

  • de grondslag voor het aan Open Data doen, zoals een raadsbesluit van een gemeente
  • de hoofdlijnen van het Open Data beleid
  • Een proclaimer waarin duidelijk gemaakt wordt wat gebruikers wel en niet mogen verwachten
  • Een contact persoon - bij voorkeur de Open Data steward - waar gebruikers terecht kunnen met vragen en opmerkingen

Naar stap 4...