Cílem tohoto dokumentu je specifikovat rozhraní lokálních katalogů otevřených dat (LKOD) pro jejich harvestování Národním katalogem otevřených dat (NKOD). Stejná specifikace platí i pro datový model NKOD a data poskytovaná z NKOD v podobě souborů ke stažení či SPARQL endpointu. Nejprve je specifikován datový model katalogizačního záznamu. Poté jsou specifikovány 2 varianty rozhraní pro harvestaci, které jsou založeny na standardu DCAT-AP 2.0.1, jedna využívá SPARQL endpoint a jedna specifikuje variantu uložení záznamů v souborech, bez použití SPARQL endpointu.
Provozování lokálního katalogu otevřených dat (LKOD) je jedním ze způsobů zajištění katalogizace dat v Národním katalogu otevřených dat (NKOD), což je jedna ze zákonných podmínek pro to, aby data mohla být nazývána otevřenými daty. Tento způsob katalogizace je vhodný pro střední a větší organizace, u kterých se dá předpokládat katalogizace většího množství datových sad či častější aktualizace jejich metadat.
Oproti doporučení ze 4.4.2019 jsou v této OFN následující změny:
schema:startDate
a schema:endDate
na dcat:startDate
a dcat:endDate
V této sekci jsou popsány položky, které mohou být evidované v Národním katalogu otevřených dat (NKOD) pro každou datovou sadu a její distribuci. Položky se řídí standardem DCAT Application Profile for data portals in Europe Version 2.0.1 (DCAT-AP 2.0.1). Jedná se o standard založený na propojených datech, předpokládá se tedy znalost Otevřené formální normy Propojená data.
DCAT-AP 2.0.1 rozlišuje tři základní typy entit. Datovou sadu, její distribuci a datovou službu. Metadata datové sady ji popisují bez ohledu na konkrétní reprezentaci jejích dat. Ta je popsána jako distribuce datové sady, která reprezentuje buď soubor ke stažení, nebo odkazuje na datovou službu, přes kterou jsou data k dispozici. Distribucí může mít datová sada více, lišit se ale mohou pouze formátem souboru ke stažení (např. CSV či JSON) či způsobem zpřístupnění (soubor ke stažení či datová služba). Obsahově by distribuce měly být ekvivalentní.
V popisu položek a rozhraní budou použity následující prefixy slovníků.
dcat: http://www.w3.org/ns/dcat#
dct: http://purl.org/dc/terms/
foaf: http://xmlns.com/foaf/0.1/
rdfs: http://www.w3.org/2000/01/rdf-schema#
schema: http://schema.org/
skos: http://www.w3.org/2004/02/skos/core#
xsd: http://www.w3.org/2001/XMLSchema#
vcard: http://www.w3.org/2006/vcard/ns#
pu: https://data.gov.cz/slovník/podmínky-užití/
Pro přehlednost zápisu budou použity ještě následující prefixy zkracující IRI vzorových entit.
sada: https://data.gov.cz/zdroj/datová-sada/1
katalog: https://data.gov.cz/zdroj/katalog/1
distribuce: https://data.gov.cz/zdroj/datová-sada/1/distribuce/1
služba: https://data.gov.cz/zdroj/datová-sada/1/distribuce/2/datová-služba
čas: https://data.gov.cz/zdroj/datová-sada/1/časové-pokrytí
kontakt: https://data.gov.cz/zdroj/datová-sada/1/kontaktní-bod
podmínky: https://data.gov.cz/zdroj/datová-sada/1/distribuce/1/podmínky-užití
správce: https://data.gov.cz/zdroj/katalog/kontaktní-bod
katalog: a dcat:Catalog .
název
, dct:title
katalog: dct:title "Katalog otevřených dat Ministerstva dopravy"@cs, "Open Data Catalog of the Ministry of Transport"@en .
popis
, dct:description
katalog: dct:description "Otevřená data Ministerstva dopravy. Obsahuje datové sady o jízdních řádech a liniových vedeních veřejné dopravy."@cs, "Open data of the Ministry of Transport. It contains datasets regarding timetables of public transport."@en .
poskytovatel
, dct:publisher
katalog: dct:publisher <https://rpp-opendata.egon.gov.cz/odrpp/zdroj/orgán-veřejné-moci/66003008> .
kontaktní_bod
, dcat:contactPoint
vcard:Kind
s vlastnostmi vcard:fn
a vcard:hasEmail
.
katalog: dcat:contactPoint správce: . správce: a vcard:Individual ; vcard:fn "Jan Novák"@cs ; vcard:hasEmail <mailto:jan.novak@organizace.cz> .
domovská_stránka
, foaf:homepage
katalog: foaf:homepage <https://data.gov.cz/> .
datová_sada
, dcat:dataset
katalog: dcat:dataset sada: .
sada: a dcat:Dataset .
název
, dct:title
sada: dct:title "Kontroly plnění povinností zaměstnavatelů v oblasti sociálního zabezpečení"@cs, "Duty fulfillment inspections in the area of social security"@en .
popis
, dct:description
sada: dct:description "Statistika kontrol plnění povinností zaměstnavatelů v oblasti sociálního zabezpečení od roku 2009"@cs, "Social security statistics for 2009"@en .
poskytovatel
, dct:publisher
sada: dct:publisher <https://rpp-opendata.egon.gov.cz/odrpp/zdroj/orgán-veřejné-moci/66003008> .
téma
, dcat:theme
sada: dcat:theme <http://publications.europa.eu/resource/authority/data-theme/TRAN> .
periodicita_aktualizace
, dct:accrualPeriodicity
sada: dct:accrualPeriodicity <http://publications.europa.eu/resource/authority/frequency/MONTHLY> .
klíčové_slovo
, dcat:keyword
sada: dcat:keyword "kontrola"@cs, "statistika"@cs, "inspection"@en, "statistics"@en .
prvek_rúian
, dct:spatial
sada: dct:spatial <https://linked.cuzk.cz/resource/ruian/stat/1> .
geografické_území
, dct:spatial
sada: dct:spatial <http://publications.europa.eu/resource/authority/continent/EUROPE> .
sada: dct:spatial <https://sws.geonames.org/6290257/> .
časové_pokrytí
, dct:temporal
dct:PeriodOfTime
s vlastnostmi dcat:startDate
a dcat:endDate
, které mají datový typ xsd:date
.
sada: dct:temporal čas: . čas: dcat:startDate "2009-01-01"^^xsd:date ; dcat:endDate "2017-12-31"^^xsd:date .
kontaktní_bod
, dcat:contactPoint
vcard:Kind
s vlastnostmi vcard:fn
a vcard:hasEmail
.
sada: dcat:contactPoint kontakt: . kontakt: a vcard:Individual ; vcard:fn "Jan Novák"@cs ; vcard:hasEmail <mailto:jan.novak@organizace.cz> .
dokumentace
, foaf:page
sada: foaf:page <https://data.cssz.cz/documentation/kontroly-plneni-povinnosti-zamestnavatelu-v-oblasti-socialniho-zabezpeceni> .
specifikace
, dct:conformsTo
sada: dct:conformsTo <https://ofn.gov.cz/turistické-cíle/2020-07-01/> .
koncept_euroVoc
, dcat:theme
sada: dcat:theme <http://eurovoc.europa.eu/1001>, <http://eurovoc.europa.eu/4050> .
prostorové_rozlišení_v_metrech
, dcat:spatialResolutionInMeters
"0.5"
časové_rozlišení
, dcat:temporalResolution
xsd:duration
P1D
je_součástí
, dct:isPartOf
sada: dct:isPartOf <https://datový.katalog.cz/zdroj/datové-sady/zastřešující> .
distribuce
, dcat:distribution
sada: dcat:distribution distribuce: .
distribuce: a dcat:Distribution.
podmínky_užití
, pu:specifikace
pu:Specifikace
s vlastnostmi pu:autorské-dílo
, pu:databáze-jako-autorské-dílo
, pu:databáze-chráněná-zvláštními-právy
a pu:osobní-údaje
.
distribuce: pu:specifikace podmínky: . podmínky: a pu:Specifikace ; pu:autorské-dílo <https://data.gov.cz/podmínky-užití/neobsahuje-autorská-díla/> ; pu:databáze-jako-autorské-dílo <https://data.gov.cz/podmínky-užití/není-autorskoprávně-chráněnou-databází/> ; pu:databáze-chráněná-zvláštními-právy <https://data.gov.cz/podmínky-užití/není-chráněna-zvláštním-právem-pořizovatele-databáze/> ; pu:osobní-údaje <https://data.gov.cz/podmínky-užití/neobsahuje-osobní-údaje/> .
soubor_ke_stažení
, dcat:downloadURL
distribuce: dcat:downloadURL <https://data.cssz.cz/dump/kontroly-plneni-povinnosti-zamestnavatelu-v-oblasti-socialniho-zabezpeceni.csv> .
přístupové_url
, dcat:accessURL
distribuce: dcat:accessURL <https://data.cssz.cz/dump/kontroly-plneni-povinnosti-zamestnavatelu-v-oblasti-socialniho-zabezpeceni.csv> .
formát
, dct:format
distribuce: dct:format <http://publications.europa.eu/resource/authority/file-type/CSV> .
typ_média
, dcat:mediaType
distribuce: dcat:mediaType <http://www.iana.org/assignments/media-types/text/csv> .
schéma
, dct:conformsTo
distribuce: dct:conformsTo <https://data.cssz.cz/dump/kontroly-plneni-povinnosti-zamestnavatelu-v-oblasti-socialniho-zabezpeceni-schema.json> .
typ_média_komprese
, dcat:compressFormat
distribuce: dcat:compressFormat <http://www.iana.org/assignments/media-types/application/zip> .
typ_média_balíčku
, dcat:packageFormat
distribuce: dcat:packageFormat <http://www.iana.org/assignments/media-types/application/zip> .
název
, dct:title
distribuce: dct:title "Kontroly plnění povinností zaměstnavatelů v oblasti sociálního zabezpečení v CSV."@cs, "CSV representation of inspections in the area of social security."@en .
přístupová_služba
, dcat:accessService
distribuce: dcat:accessService služba: .
služba: a dcat:DataService .
název
, dct:title
služba: dct:title "SPARQL endpoint České správy sociálního zabezpečení"@cs, "Czech Social Security Administration SPARQL endpoint"@en .
přístupový_bod
, dcat:endpointURL
https://data.cssz.cz/sparql
specifikace
, dct:conformsTo
služba: dct:conformsTo <https://www.w3.org/TR/sparql11-protocol/> .
popis_přístupového_bodu
, dcat:endpointDescription
https://data.cssz.cz/sparql
Toto rozhraní předpokládá, že metadata datových sad dle této specifikace jsou uložena a přístupná ve SPARQL endpointu.
Po registraci tohoto SPARQL endpointu se na něm NKOD zeptá nejprve na seznam instancí třídy dcat:Dataset
, a poté se po skupinách bude ptát na povinné, nepovinné i další položky jednotlivých datových sad dle této specifikace a specifikace DCAT-AP 2.0.1.
Jedná se o nejjednodušší způsob registrace lokálního katalogu otevřených dat.
Datové sady, distribuce a datové služby musí být identifikovány svými IRI, nesmí se jednat o RDF blank nody.
V této sekci uvádíme příklady katalogů užívajících rozhraní SPARQL endpoint.
Tato varianta rozhraní je určena pro instituce, které nechtějí nebo nemohou provozovat pro účely harvestace metadat o datových sadách do NKOD SPARQL endpoint.
Počítá se serializací metadat o datových sadách do statických souborů umístěných na web.
Jako indexový soubor pak poslouží soubor obsahující instanci třídy dcat:Catalog
, která pomocí vlastnosti dcat:dataset
ukazuje na URL jednotlivých datových sad.
Při přístupu na tato URL datových sad NKOD předpokládá, že v odpovědi dostane kompletní katalogizační záznam pro danou datovou sadu, včetně jejích distribucí a datových služeb.
Datové sady, distribuce a datové služby musí být identifikovány svými IRI, nesmí se jednat o RDF blank nody.
Soubor katalogu je soubor v RDF serializaci Turtle či JSON-LD, který obsahuje instanci třídy dcat:Catalog
a odkazy na jednotlivé katalogizované datové sady.
Na URL specifikovaných v souboru katalogu pak NKOD očekává soubory v RDF serializaci Turtle či JSON-LD obsahující kompletní metadatový záznam datové sady, včetně distribucí.
V této sekci uvádíme příklady katalogů užívajících rozhraní DCAT-AP Dokumenty.
CKAN API implementované v katalozích CKAN již v této verzi OFN není podporováno kvůli stále většímu nesouladu se standardem DCAT-AP. Lze ho tedy využít pouze interně jako základ pro řádnou implementaci jednoho z rozhraní LKOD založených na standardu DCAT-AP 2.0.1.