Nationaal Georegister

24.PNG

Data.overheid.nl synchroniseert dagelijks met het Nationaal GeoRegister (NGR). Het NGR wordt beheerd door het Kadaster. Niet alle datasets uit het NGR worden overgenomen in data.overheid.nl. Daarnaast wordt ook niet alle metadata van een dataset overgenomen. NGR heeft rijkere metadata. Op data.overheid.nl is alleen de metadata te vinden die in het DCATAP-NL-profiel noodzakelijk is. Er wordt doorverwezen naar NGR of de betreffende data-eigenaar voor meer informatie. 

Tijdens de dagelijkse synchronisatie wordt informatie over dataset die in NGR is opgenomen, vertaald naar het informatiemodel van data.overheid.nl. De "mapping" is ingesteld zodat bijvoorbeeld organisatienamen worden herkend en genormaliseerd en geo-thema's worden omgezet naar rijksoverheid-thema's. 

Selectie datasets

Niet alle datasets uit NGR worden overgezet naar data.overheid.nl. Alleen datasets in NGR die voldoen aan de volgende parameters worden overgenomen: 

  1. licentie = CC0 of CC-BY of Public Domain
  2. type = "dataset"

Dit betekent dat datasets met bijvoorbeeld een "geogedeeld" licentie niet overkomen naar data.overheid.nl. Ook datasets die als type "serie" of "service" hebben, komen niet over naar data.overheid.nl. 

Mapping van waarden

Tijdens de synchronisatie vindt "mapping" plaats om de metadata van datasets om te zetten naar het "generieke" informatiemodel van data.overheid.nl. De volgende mappings worden in ieder geval uitgevoerd:

  1. mapping: ISO (NGR) -> DCAT-AP-NL (data.overheid.nl) velden
  2. mapping van specifieke velden: 
    1. organisatienaam (uit contactpersoon-velden van NGR) naar OWMS naam uit de data.overheid.nl taxonomie
    2. licenties (uit licenties van NGR) naar 
    3. formaten naar standaard CKAN formaten lijst
    4. taal naar iso taalcode in CKAN

Wijze van synchronisatie

Data.overheid.nl haalt minimaal één keer tot soms drie keer per dag de data op bij NGR volgens het CSW protocol. Dit proces heet "harvesting". Dit betekent dat de aantallen datasets per dag kunnen verschillen. Er vindt steeds een volledige synchronisatie plaats waarbij alle datasets worden vernieuwd. 

Opvraag Query:

De query die aan NGR wordt gesteld om data.overheid.nl te voeden: 

<?xml version="1.0" encoding="UTF-8"?>
<csw:GetRecords
             xmlns:csw="http://www.opengis.net/cat/csw/2.0.2"
             xmlns:gmd="http://www.isotc211.org/2005/gmd"
             service="CSW"
             version="2.0.2"
             outputFormat="application/xml"
             outputSchema="http://www.isotc211.org/2005/gmd"
             resultType="results"
             startPosition="1"
             maxRecords="10"
             >
       <csw:Query typeNames="csw:Record">
             <csw:ElementSetName>full</csw:ElementSetName>
             <csw:Constraint version="1.1.0">
                    <ogc:Filter xmlns:ogc="http://www.opengis.net/ogc">
                           <ogc:And>
                                  <ogc:Or>
                                        <ogc:PropertyIsLike wildcard="*" singleChar="." escapeChar="!">
                                               <ogc:PropertyName>OtherConstraints</ogc:PropertyName>
                                               <ogc:Literal>*http://creativecommons.org/publicdomain/mark/1.0/deed.nl*</ogc:Literal>
                                        </ogc:PropertyIsLike>
                                        <ogc:PropertyIsLike wildcard="*" singleChar="." escapeChar="!">
                                               <ogc:PropertyName>OtherConstraints</ogc:PropertyName>
                                               <ogc:Literal>*http://creativecommons.org/publicdomain/zero/1.0/*</ogc:Literal>
                                        </ogc:PropertyIsLike>
                                        <ogc:PropertyIsLike wildcard="*" singleChar="." escapeChar="!">
                                               <ogc:PropertyName>OtherConstraints</ogc:PropertyName>
                                               <ogc:Literal>*http://creativecommons.org/licenses/by/*</ogc:Literal>
                                        </ogc:PropertyIsLike>
                                  </ogc:Or>
                                  <ogc:PropertyIsLike wildcard="*" singleChar="." escapeChar="!">
                                        <ogc:PropertyName>Type</ogc:PropertyName>
                                        <ogc:Literal>*dataset*</ogc:Literal>
                                  </ogc:PropertyIsLike>
                           </ogc:And>
                    </ogc:Filter>
             </csw:Constraint>
       </csw:Query>
</csw:GetRecords>