Metadata DCAT

Dit document beschrijft een applicatieprofiel, in dit geval Metadata DCAT. Dit applicatieprofiel beantwoordt de vraag over hoe het corresponderende domeinmodel in de praktijk kan toegepast worden. Daarbij worden de beperkingen (kardinaliteit, codelijsten) toegelicht en de overeenkomstige (RDF) termen opgelijst.

Samenvatting

Het applicatieprofiel “metadata dcat”. Dit is een applicatieprofiel gebaseerd op DCAT en richt zich op het verzamelen van informatie over generieke datasets, distributies en services die door een overheid beschikbaar gesteld worden. De datasets en services omvatten zowel publiek toegankelijke als afgeschermde data en diensten (ontwikkeld in en voor eender welk technisch perspectief). Het samenbrengen van al deze informatie in een catalogus laat toe om de vindbaarheid van deze datasets en services te verhogen. Dit applicatieprofiel is het generieke basisprofiel. Afgeleide profielen kunnen zeker aangemaakt worden voor specifieke domeinen of communities. Bijvoorbeeld is DCAT-AP-VL zo’n afgeleid applicatieprofiel, specifiek voor het Open data domein en bijhorende community.

Status van dit document

Dit applicatieprofiel heeft status Kandidaat Standaard en werd uitgegeven op 2021-03-23.

Informatie over het gevolgde proces en de beslissingen om tot deze specificatie te komen zijn beschikbaar in het standaardenregister.

Licentie

Deze specificatie van Informatie Vlaanderen is gepubliceerd onder de "Modellicentie Gratis Hergebruik - v1.0".

Conformiteit

Een applicatieprofiel is een specificatie voor gegevensuitwisseling dat bijkomende beperkingen introduceert voor het toepassen van vocabularia. Dergelijke bijkomende beperkingen kunnen de volgende elementen bevatten:

  • Verfijning van de terminologie (klassen en eigenschappen) consistent met de semantiek uit de betreffende specificaties met een welbepaald gebruik als doel.
  • Externe terminologie (klassen en eigenschappen) gebruikt voor nieuwe/extra termen die niet in de bestaande vocabularia voorkomen.

Om conform te zijn met dit applicatieprofiel, geldt voor een implementatie dat ze:

  • MOET conform zijn aan de verplichtingen van DCAT.
  • MOET voor elke klasse steeds de eigenschappen bevatten die als minimum kardinaliteit 1 hebben.
  • MAG NIET meer dan 1 instantie bevatten van eigenschappen die 1 als maximum kardinaliteit hebben.
  • MAG terminologie (klassen en eigenschappen) gebruiken op een manier die consistent is met haar semantiek (definitie, gebruik, domein en bereik).
  • MAG uitgebreid worden met klassen en eigenschappen van andere datamodellen (vocabularia) die niet overlappen met terminologie vermeld in dit document of in DCAT, DCAT-AP.
  • PAST maximaal de algemene en specifieke gebruiksadviezen toe.

Algemene gebruikadviezen

  • Zorg voor stabiele identificatoren voor datasets en dataservices, en waar mogelijk ook voor alle andere vermelde entiteiten.
  • Gebruik enkel absolute URLs. Dan blijft onder alle verwerkingsoperaties van de catalogus de URL identiek en is er geen kwaliteitsverlies voor de gebruiker.
  • Voor temporele informatie wordt verwacht dat de tijdzone wordt meegegeven.
  • Indien gekozen wordt om de geografische beschrijving als een geometrie mee te geven, dan wordt best gekozen voor een beschrijving met expliciete vermelding van het gebruikte Coordinaten Referentie Systeem (CRS).
  • Beschrijvende informatie zoals titels en beschrijvingen zijn taalafhankelijk. Voorzie voor elke taal slechts één waarde.

Informatieveiligheid

Een semantische specificatie richt zich in de eerste plaats op het maken van afspraken rond de betekenis van termen. Dit is bij uitstek het doel van een vocabularium. Applicatieprofielen zijn gericht op afspraken in een brede gebruikscontext. Daardoor omvatten zij meer en specifieke beperkingen die het gebruik ten goede komen.

Een van de aspecten voor het gebruik van de specificatie is informatieveiligheid. Het merendeel van de bezorgdheden i.v.m. informatieveiligheid hebben geen directe invloed op een applicatieprofiel. Ze zijn dikwijls van technische aard die buiten de semantische afspraken vallen zoals het encrypteren van datastromen. Bij voorkeur worden deze twee werelden zoveel mogelijk gescheiden en enkel samengevoegd in een implementatie.

Echter sommige afspraken zijn beïnvloedbaar door informatieveiligheid. Voorbeelden hiervan zijn het al dan niet verplichten van een eigenschap of de range van een eigenschap (een identificator versus een string). Het is aan de opstellers van de specificatie om de juiste balans te vinden.

Voor metadata voor services is een belangrijke gebruikscontext het aggregeren van catalogi komende van verschillende organisaties. Het doel is om deze aggregatie als geheel ter beschikking te stellen van het publiek. Omdat entiteiten van de ene catalogus kunnen verwijzen naar entiteiten van andere catalogi, is het zo goed als onmogelijk om een verschillende informatieveiligheidspolitiek te voeren per ter aggregeren catalogus. Daarom wordt dit niet opgenomen als onderdeel van de specificatie. Indien dit gewenst is, dan zal dit een implementatieafspraak worden.

Omdat de basis van de usecase het publiekelijk delen van informatie is, wordt aangenomen dat de informatiestructuur zoals die in de specificatie opgenomen is ook in die vorm kan gedeeld worden. Informatie waarvan kennis is genomen die omwille van een of andere reden niet publiek kan gemaakt worden, zal dus niet verplicht worden. Dikwijls zal die informatie via een andere eigenschap, via een toegangspagina, te vinden zijn voor de gebruiker van de geaggregeerde catalogus.

Service beschrijving en de payload beschrijving

Indien een data service beschreven wordt dan is er meestal ook de noodzaak om informatie te geven over de data die ontsloten wordt via de dataservice. Om dit onderscheid eenduidig vast te leggen wordt de volgende ontwerpbeslissing gevolgd. Eigenschappen die rechtstreeks te maken hebben met de dataservice zijn eigenschappen van de dataservice. Eigenschappen die slaan op de ontsloten data zijn eigenschappen van de verbonden aangeboden dataset (of datasets). Bijvoorbeeld, de eigenschap taal voor een dataservice: de service kan in het Engels geschreven zijn waarbij deze antwoordt op queries in het Engels, terwijl de data uit de dataset die aangeboden wordt in die dataservice Nederlandstalig is. Echter indien men wil aangeven dat de informatie ontsloten wordt slechts beschikbaar is in het Nederlands, dan wordt dat aangegeven als waarde voor de taal eigenschap van de aangeboden dataset.

Onderscheid distributie en dataservice

In een dagdagelijks gesprek over datasets en hun onsluitingsvormen wordt de term distributie gebruikt in een brede zin. Een distributie is daarin de aanduiding van eender welke vorm van ontsluiting. DCAT heeft ervoor gekozen om een service als een onafhankelijke entiteit op te nemen. Hierdoor ontstaat een spanningsveld tussen de dagdagelijkse terminologie en de formele terminologie van DCAT. Echter zelfs op basis van de definities in DCAT kan men geen precies afgelijnd onderscheid maken tussen een distributie en een dataservice.

Om de catalogusbeheerders in Vlaanderen een uniformere aanpak te geven, wordt het volgende afgesproken. Een distributie zal voornamelijk gebruikt worden om een afgerond geheel van data aan te duiden. Iets dat downloadbaar is als een file. Een dataset is een abstracte entiteit (een naam voor een geheel aan data); een distributie van de dataset is een concrete vorm die de afnemer van de dataset lokaal kan gebruiken zonder enige andere systeemtoegang. Een distributie zal dus niet bestaan zonder een dataset.

Alle andere vormen zullen als een dataservice beschreven worden. Een dataservice heeft dikwijls een hoge mate van onafhankelijkheid van een distributie (effectieve data) van een dataset; het kan zelfs niet gebonden zijn aan één dataset. Of het biedt een slimme toegang tot de data (bv. via een query interface).

Overzicht

In dit document wordt correct gebruik van de volgende entiteiten toegelicht:
| Agent | Catalogus | Catalogus Record | Catalogus Resource | Dataservice | Dataset | Distributie | Juridische bepaling | Licentie Document | Standaard |

In dit document worden de volgende datatypes toegelicht:
| Contactinfo |

Entiteiten

Agent

Beschrijving
Iemand die of iets dat kan handelen of een effect kan teweeg brengen.
Gebruik
Een agent kan op verschillende wijzen interageren met de beschreven entiteiten. Voorbeelden zijn beheerder, uitgever, maker, enz.
Eigenschappen
Voor deze entiteit zijn de volgende eigenschappen gedefinieerd: naam.
Eigenschap Verwacht Type Kardinaliteit Beschrijving Gebruik Codelijst
naam TaalString 1..n De naam van de agent. Omwille van de meertaligheid kunnen er meerdere waarden zijn. De gewenste interpretatie van de cardinaliteit is: per taal slechts 1 waarde.

Catalogus

Beschrijving
Een beheerde verzameling van metadata over resources (zoals datasets en dataservices in de context van een datacatalogus).
Gebruik
[Zie DCAT]
Eigenschappen
Voor deze entiteit zijn de volgende eigenschappen gedefinieerd: alternatieve identificator, beschrijving, contactinformatie, heeft DataService, heeft Dataset, identificator, licentie, record, titel, uitgever.
Eigenschap Verwacht Type Kardinaliteit Beschrijving Gebruik Codelijst
alternatieve identificator Identificator 0..n Een alternatieve identificator (dan de unieke identificator) voor de catalogus kan hier beschreven worden.
beschrijving TaalString 1 Een bondige tekstuele omschrijving van de catalogus. [Zie DCAT]
contactinformatie Contactinfo 1 De relevante contactinformatie waarmee een eindgebruiker in contact kan treden met de verantwoordelijken van de catalogus. [Zie DCAT]
heeft DataService Dataservice 0..* Een dataservice die deel uitmaakt van de catalogus.
heeft Dataset Dataset 0..* Een dataset die deel uitmaakt van de catalogus.
identificator Literal 1 De unieke identificator voor de catalogus. [Zie DCAT]
licentie Licentie Document 0..1 De licentie van de catalogus.
record Catalogus Record 0..* Een record beschrijft de registratie van één enkele dataset of dataservice die onderdeel is van de catalogus. [Zie DCAT]
titel TaalString 1 De naam van de catalogus. [Zie DCAT]
uitgever Agent 1 De uitgever, de entiteit die verantwoordelijk is voor het beschikbaar stellen, van de catalogus. [Zie DCAT]

Catalogus Record

Beschrijving
Een record in een catalogus beschrijft de registratie van één resource in de catalogus.
Gebruik
[Zie DCAT]
Eigenschappen
Voor deze entiteit zijn de volgende eigenschappen gedefinieerd: aanmaakdatum, alternatieve identificator, hoofdonderwerp, identificator, titel, wijzigingsdatum.
Eigenschap Verwacht Type Kardinaliteit Beschrijving Gebruik Codelijst
aanmaakdatum DateTime 0..1 De datum van (formele) opname van de bijbehorende dataset of dataservice in de catalogus. [Zie DCAT]
alternatieve identificator Identificator 0..n Een alternatieve identificator (dan de unieke identificator) voor een record in de catalogus kan hier beschreven worden.
hoofdonderwerp Catalogus Resource 1 De resource (dataset of dataservice) beschreven in het record. [Zie DCAT]
identificator Literal 1 De unieke identificator van het record in de catalogus. [Zie DCAT]
titel TaalString 0..1 De naam van het record in de catalogus. [Zie DCAT]
wijzigingsdatum DateTime 1 De meest recente datum waarop de record in de catalogus is gewijzigd, bijgewerkt of aangepast.

Catalogus Resource

Beschrijving
Een bron (resource) gepubliceerd of beheerd door één agent.
Gebruik
[Zie DCAT]
Eigenschappen
Voor deze entiteit zijn de volgende eigenschappen gedefinieerd: uitgever.
Eigenschap Verwacht Type Kardinaliteit Beschrijving Gebruik Codelijst
uitgever Agent 1 De uitgever, de entiteit die verantwoordelijk is voor het beschikbaar stellen, van de resource in de catalogus. [Zie DCAT]

Dataservice

Beschrijving
Een verzameling van operaties die ofwel toegang bieden tot één of meer datasets ofwel een dataverwerkingsdoel hebben.
Gebruik
[Zie DCAT]
Subklasse van
Catalogus Resource
Eigenschappen
Voor deze entiteit zijn de volgende eigenschappen gedefinieerd: alternatieve identificator, beschrijving, biedt informatie aan over, conform aan protocol, contactinformatie, endpointbeschrijving, endpointURL, identificator, landingspagina, landingspagina voor authenticatie, landingspagina voor gebruiksinformatie, landingspagina voor statusinformatie, levensfase, licentie, ontwikkelingstoestand, rechten, thema, titel, toegankelijkheid, trefwoord, versie.
Eigenschap Verwacht Type Kardinaliteit Beschrijving Gebruik Codelijst
alternatieve identificator Identificator 0..n Een alternatieve identificator (dan de unieke identificator) voor een dataservice kan hier beschreven worden.
beschrijving TaalString 0..1 Een bondige tekstuele omschrijving van de dataservice. [Zie DCAT]
biedt informatie aan over Dataset 0..* De data die via deze dataservice worden aangeboden. [Zie DCAT]
conform aan protocol Standaard 0..n Een protocol waaraan de dataservice voldoet. Deze eigenschap capteert de technische specificatie waaraan de service voldoet. Voorbeelden zijn WFS, SPARQL, SOAP,…
contactinformatie Contactinfo 1 De relevante contactinformatie waarmee een eindgebruiker in contact kan treden met de verantwoordelijken van de dataservice. [Zie DCAT]
endpointbeschrijving URI 1 Een beschrijving van de diensten die beschikbaar zijn via de end-points, met inbegrip van hun operaties, parameters, enz. [Zie DCAT]
endpointURL URI 0..1 De rootlocatie of het primaire endpoint van de dienst (een web-resolvable URI). [Zie DCAT]
identificator Literal 1 De unieke identificator van de dataservice. [Zie DCAT]
landingspagina URI 0..n Een algemene webpagina waarnaar kan worden genavigeerd in een webbrowser, met algemene aanvullende informatie over de dataservice. [Zie DCAT]
landingspagina voor authenticatie URI 0..1 Een verwijzing naar de landingspagina met de specifieke informatie over de authenticatie voor de dataservice. Deze eigenschap capteert een onderdeel van de beschrijvende informatie over de service beschreven in de landingspagina. Enkel te gebruiken indien men kan verwijzen naar een sectie of een aparte pagina waar deze specifieke informatie beschikbaar is.
landingspagina voor gebruiksinformatie URI 0..1 Een verwijzing naar de landingspagina met de specifieke informatie over het gebruik van de dataservice.
landingspagina voor statusinformatie URI 0..1 Een verwijzing naar de statuspagina van de dataservice
levensfase Code 0..1 De levensfase waarin de dataservice zich bevindt. Het gebruik hiervan is voornamelijk belangrijk wanneer men de data service wil uit dienst nemen. Het tijdig aangeven dat een dienst op zijn einde loopt en dat de gebruiker moet overschakelen op de nieuwe dienst is een onderdeel van goed service management. Link
licentie Licentie Document 0..1 De licentie van de dataservice. [Zie DCAT]
ontwikkelingstoestand Code 0..1 De ontwikkelingstoestand waarin de dataservice is gedeployed. Op verschillende momenten tijdens de ontwikkeling van een data service wordt de data service geëvalueerd. Link
rechten Juridische bepaling 0..n Bepalingen van juridische aard die gelden op de dataservice. Met deze eigenschap kunnen rechten uitgedrukt worden zoals copyright of specifieke gebruiksbepalingen. Ook SLA en SLO informatie kan hier opgenomen worden. Indien deze rechten reeds opgenomen zijn in de licentie dan moeten ze niet hier herhaald worden.
thema Code 0..n De hoofdcategorie waartoe de dataservice behoort. Link
titel TaalString 1 De naam van de dataservice. [Zie DCAT]
toegankelijkheid Code 1 De toegankelijkheid voor de dataservice. Gebruik enkel de waarden PUBLIC en NON_PUBLIC uit de codelijst. Link
trefwoord TaalString 0..n Een trefwoord of tag die de resource beschrijft. [Zie DCAT]
versie String 0..1 Een unieke aanduiding van een variant van de dataservice door middel van een versienummer of -naam van de dataservice. Voor dataservices wordt dikwijls semantisch versioneren (https://semver.org/lang/nl/) gebruikt. Bij het deployen van services wordt aangeraden om enkel de major version op te nemen in de endpointurl. De versieinformatie die hier opgegeven wordt komt best overeen met de versie die beschikbaar is in de endpointurl.

Dataset

Beschrijving
Een verzameling gegevens, gepubliceerd of samengesteld door één agent, en beschikbaar voor toegang of download in één of meerdere voorstellingswijzen.
Gebruik
[Zie DCAT]
Subklasse van
Catalogus Resource
Eigenschappen
Voor deze entiteit zijn de volgende eigenschappen gedefinieerd: alternatieve identificator, beschrijving, conform, contactinformatie, distributie, identificator, landingspagina, thema, titel, toegankelijkheid, trefwoord, versie.
Eigenschap Verwacht Type Kardinaliteit Beschrijving Gebruik Codelijst
alternatieve identificator Identificator 0..n Een alternatieve identificator (dan de unieke identificator) voor een dataset kan hier beschreven worden.
beschrijving TaalString 1 Een bondige tekstuele omschrijving van de dataset. [Zie DCAT]
conform Standaard 0..n Een standaard, schema, applicatieprofiel, vocabularium waaraan de dataset voldoet.
contactinformatie ContactInfo 1 De relevante contactinformatie waarmee een eindgebruiker in contact kan treden met de verantwoordelijken van de dataset. [Zie DCAT]
distributie Distributie 0..* Een beschikbare distributie van de dataset. [Zie DCAT]
identificator Identificator 1 De unieke identificator van de dataset. [Zie DCAT]
landingspagina URI 0..n Een algemene webpagina waarnaar kan worden genavigeerd in een webbrowser, met algemene informatie over de dataset, zijn distributies en/of aanvullende informatie. [Zie DCAT]
thema Code 0..n De hoofdcategorie waartoe de dataset behoort. [Zie DCAT] Link
titel TaalString 1 De naam van de dataset. [Zie DCAT]
toegankelijkheid Code 1 De toegankelijkheid voor de dataset. Gebruik enkel de waarden PUBLIC en NON_PUBLIC uit de codelijst. Link
trefwoord TaalString 0..n Een trefwoord of tag die de resource beschrijft. [Zie DCAT]
versie String 0..1 Een unieke aanduiding van een variant van de dataset door middel van een versienummer of -naam van de dataset. [Zie DCAT-ap]

Distributie

Beschrijving
Een specifieke voorstellingswijze van een dataset, gekenmerkt door één of meerdere eigenschappen zoals taal, media-type of formaat, schematische organisatie, temporele en ruimtelijke resolutie, granulariteit, ...
Gebruik
[Zie DCAT]
Eigenschappen
Voor deze entiteit zijn de volgende eigenschappen gedefinieerd: alternatieve identificator, downloadURL, identificator, licentie, rechten, titel, toegangsURL, wordt aangeboden door.
Eigenschap Verwacht Type Kardinaliteit Beschrijving Gebruik Codelijst
alternatieve identificator Identificator 0..n Een alternatieve identificator (dan de unieke identificator) voor een distributie kan hier beschreven worden.
downloadURL URI 0..1 De URL waar de data gedownload kan worden. De URL start het downloaden van de distributie.
identificator Literal 1 De unieke identificator van de distributie. [Zie DCAT]
licentie Licentie Document 0..1 De licentie van de distributie. [Zie DCAT]
rechten Juridische bepaling 0..n Bepalingen van juridische aard die gelden op de distributie. Met deze eigenschap kunnen rechten uitgedrukt worden zoals bronvermeldingen, copyright of specifieke gebruiksbepalingen. Indien deze rechten reeds opgenomen zijn in de licentie dan moeten ze niet hier herhaald worden.
titel TaalString 0..1 De naam van de distributie. [Zie DCAT]
toegangsURL URI 1 Een URL waar de data kan gevonden worden. Deze url kan zowel verwijzen naar een beschrijvende pagina over hoe toegang tot de data kan verkregen worden als naar een directe link waarmee het downloaden van de distributie gestart kan worden. In het tweede geval wordt ook de eigenschap downloadURL bijkomend ingevuld.
wordt aangeboden door Dataservice 0..* Een dataservice die deze distributie aanbiedt. [Zie DCAT]

Juridische bepaling

Beschrijving
Een uitspraak of uitdrukking i.v.m. een recht dat verleend wordt bij het gebruiken van een resource.
Gebruik
In de context van dit applicatieprofiel moet deze klasse gezien worden als een hulpinstrument. Implementaties kunnen (moeten) het gebruik van deze klasse zelf invullen. Het kan de vorm nemen van een codelijst, maar ook van een entiteit met bijkomende eigenschappen.
Eigenschappen
Voor deze entiteit zijn geen eigenschappen gedefinieerd.

Licentie Document

Beschrijving
Een wettelijk document dat de voorwaarden waaronder men een resource mag gebruiken.
Gebruik
Het Decreet Hergebruik definieert een aantal licenties. PURIs voor de verschillende mogelijkheden zijn te vinden hier: https://data.vlaanderen.be/doc/licentie/
Eigenschappen
Voor deze entiteit zijn geen eigenschappen gedefinieerd.

Standaard

Beschrijving
Een specificatie of document dat een referentie vormt waartegen men een entiteit, of het gebruik ervan kan aftoetsen.
Gebruik
In de context van dit applicatieprofiel moet deze klasse gezien worden als een hulpinstrument. Implementaties kunnen (moeten) het gebruik van deze klasse zelf invullen. Het kan de vorm nemen van een codelijst, maar ook van een entiteit met bijkomende eigenschappen.
Eigenschappen
Voor deze entiteit zijn geen eigenschappen gedefinieerd.

Datatypes

Contactinfo

Beschrijving
Een beschrijving van contactinformatie.
Eigenschappen
Voor dit datatype zijn de volgende eigenschappen gedefinieerd: contactpagina, e-mail.
Eigenschap Verwacht Type Kardinaliteit Beschrijving Gebruik Codelijst
contactpagina URI 0..1 Een webpagina die ofwel toelaat om contact op te nemen (via b.v. een webformulier) of die informatie bevat hoe men contact kan opnemen. B.v. de webpagina van de servicedesk van de organisatie
e-mail URI 0..1 Het e-mailadres waarmee een gebruiker contact kan opnemen voor informatie. Een e-mail adres in de vorm van een mailto URI volgens de standaard https://tools.ietf.org/html/rfc6068 .

JSON-LD context

(niet normatief)

Een herbruikbare JSON-LD context definitie voor dit applicatieprofiel is terug te vinden op: /doc/applicatieprofiel/metadata-dcat/kandidaatstandaard/2021-03-23/context/metadata-voor-services-ap.jsonld

SHACL template

(niet normatief)

Een herbruikbare SHACL template definitie voor dit applicatieprofiel is terug te vinden op: /doc/applicatieprofiel/metadata-dcat/kandidaatstandaard/2021-03-23/shacl/metadata-voor-services-ap-SHACL.ttl