Cílem tohoto dokumentu je specifikovat rozhraní lokálních katalogů dat (LKD) pro jejich harvestování Národním katalogem dat (NKD). Dokument je založen na základním datovém modelu pro kataolgy dat DCAT-AP-CZ. Jsou specifikovány 2 varianty rozhraní pro harvestaci, jedna využívá SPARQL endpoint a jedna specifikuje variantu uložení záznamů v souborech, bez použití SPARQL endpointu. Specifikace metadatových záznamů datových sad v katalogu jsou popsány v samostatných specifikacích dle jejich druhu.

Úvod

Provozování lokálního katalogu dat (LKD) je jedním ze způsobů zajištění katalogizace dat v Národním katalogu dat (NKD). Tento způsob katalogizace je vhodný pro všechny organizace, u kterých se dá předpokládat katalogizace většího množství datových sad či častější aktualizace jejich metadat. Touto OFN je specifikován samotný lokální katalog dat a způsob jeho harvestace, nezávisle na typu obsažených datových sad. Pro specifikaci jednotlivých typů datových sad v katalogu slouží samostané OFN.

Typy datových sad v katalozích dat

V lokálních katalozích dat poskytovatelé katalogizují dva základní typy datových sad. Každý z typů datových sad je specifikován samostatnou OFN. Aktuálně rozlišujeme dva typy datových sad.

  1. Otevřená data pro splnění podmínky registrace otevřených dat v Národním katalogu otevřených dat. Záznamy datových sad otevřených dat jsou specifikovány OFN DCAT-AP-CZ: Datové sady otevřených dat.
  2. Údaje vedené v informačních systémech dle § 24 odst. 2 vyhlášky č. 360/2023 Sb., o dlouhodobém řízení informačních systémů veřejné správy. Záznamy těchto datových sad jsou specifikovány OFN Otevřená formální norma DCAT-AP-CZ: Specifikace pro vyhlášku č. 360/2023 Sb., o dlouhodobém řízení informačních systémů veřejné správy.

Přehled

View for DCAT-AP-CZ: Rozhraní katalogů dat
View for DCAT-AP-CZ: Rozhraní katalogů dat

Hlavní profily tříd

Katalog

IRI profilovaných tříd dcat:Catalog
IRI https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#Katalog
Název Katalog
Definice Řízená kolekce metadat o datových sadách a datových službách
Hierarchie
Popis použití v profilu A Web-based data catalog is typically represented as a single instance of this class. Datasets and data services are examples of resources in the context of a data catalog. (@en)

datová sada

IRI profilovaných vztahů dcat:dataset
IRI https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#Katalog.datováSada
Název datová sada
Definice Kolekce dat, která je katalogizována v katalogu.
Definiční obor Katalog
Obor hodnot Datová sada [0..*]
Hierarchie
Popis použití v profilu As empty Catalogues are usually indications of problems, this property should be combined with the property service to implement an empty Catalogue check. (@en)

domovská stránka

IRI profilovaných vztahů foaf:homepage
IRI https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#Katalog.domovskáStránka
Název domovská stránka
Definice Tato vlastnost odkazuje na domovskou stránku lokálního katalogu, kam mohou chodit uživatelé.
Definiční obor Katalog
Obor hodnot Dokument [0..1]
Hierarchie
Popis použití v profilu (@en)

kontaktní bod

IRI profilovaných vztahů dcat:contactPoint
IRI https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#Katalog.kontaktníBod
Název kontaktní bod
Definice Tato vlastnost obsahuje kontaktní informace, které mohou být využity pro zasílání připomínek ke katalogu.
Definiční obor Katalog
Obor hodnot Organizace [1..1]
Hierarchie

název

IRI profilovaných vztahů dcterms:title
IRI https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#Katalog.název
Název název
Definice Tato vlastnost obsahuje název datového katalogu.
Definiční obor Katalog
Obor hodnot Text [1..1]
Hierarchie
Popis použití v profilu This property can be repeated for parallel language versions of the name. (@en)

popis

IRI profilovaných vztahů dcterms:description
IRI https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#Katalog.popis
Název popis
Definice Tato vlastnost obsahuje volný text s popisem datového katalogu.
Definiční obor Katalog
Obor hodnot Text [1..1]
Hierarchie
Popis použití v profilu This property can be repeated for parallel language versions of the description. (@en)

poskytovatel

IRI profilovaných vztahů dcterms:publisher
IRI https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#Katalog.poskytovatel
Název poskytovatel
Definice Poskytovatel datového katalogu.
Definiční obor Katalog
Obor hodnot Poskytovatel [1..1]
Hierarchie

Podpůrné profily třídy

Datová sada

IRI profilovaných tříd dcat:Dataset
IRI https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#DatováSada
Název Datová sada
Definice Kolekce dat poskytovaná či řízená jedním zdrojem, která je k dispozici pro přístup či stažení v jednom či více formátech.
Hierarchie
Popis použití v profilu If a Dataset is used as part of a Dataset Series, the usage of the properties listed below must be coherent with the associated Dataset Series. For this usage, consult the guidelines in section 14. General usage guidelines. (@en)

Zpětné asociace

Dokument

IRI profilovaných tříd foaf:Document
IRI https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#Dokument
Název Dokument
Definice Textový dokument určený pro čtení lidmi. Například webová stránka.
Hierarchie

Zpětné asociace

E-mailová adresa

IRI profilovaných tříd rdfs:Resource
IRI https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#E-mailAddress
Název E-mailová adresa
Definice E-mailová adresa identifikovaná pomocí mailto: IRI.
Hierarchie

Zpětné asociace

Organizace

IRI profilovaných tříd vcard:Organization
IRI https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#Organizace
Název Organizace
Definice Organizace, právnická osoba nebo její část.
Hierarchie

Zpětné asociace

email

IRI profilovaných vztahů vcard:hasEmail
IRI https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#Organizace.email
Název email
Definice E-mailová adresa pro komunikaci.
Definiční obor Organizace
Obor hodnot E-mailová adresa [1..1]
Hierarchie

jméno

IRI profilovaných vztahů vcard:fn
IRI https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#Organizace.jméno
Název jméno
Definice Jméno objektu jako formátovaný text.
Definiční obor Organizace
Obor hodnot Text [1..1]
Hierarchie

Poskytovatel

IRI profilovaných tříd foaf:Agent
IRI https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#Poskytovatel
Název Poskytovatel
Definice Poskytovatel dat
Hierarchie
Popis použití v profilu If the Agent is an organisation, the use of the Organization Ontology is recommended. (@en)

Zpětné asociace

Série datových sad

IRI profilovaných tříd dcat:DatasetSeries
IRI https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#SérieDatovýchSad
Název Série datových sad
Definice Série datových sad zastřešuje související datové sady a jiné série. Souvislost může být časová (rozpočet v letech), prostorová (seznamy ulic v obcích) či tématická (datové sady z jednoho systému).
Hierarchie
Popis použití v profilu It is recommended to avoid Dataset Series without a dataset in the collection. Therefore at least one Dataset should refer to a Dataset Series using the property in series (dcat:inSeries). (@en)

Specifikace struktury pro Katalog

Datová struktura pro Katalog. Řízená kolekce metadat o datových sadách a datových službách

JSON struktura pro Katalog

IRI
https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat/draft/katalog/schéma.json
Definováno v
../katalog/schéma.json
Verze použitého jazyka
2020-12 (metaschema IRI: https://json-schema.org/draft/2020-12/schema)

Kořen

Kořenem JSON schématu je

Objekt Katalog

Popis Řízená kolekce metadat o datových sadách a datových službách
Interpretace Katalog
objekt s vlastnostmi (properties):
  • iri: povinná položka typu řetězec (formát: iri)
  • typ: povinná položka typu právě jedno z následujících (oneOf):
    • konstantní hodnota "Katalog"
    • pole hodnot {0..*} typu řetězec a musí obsahovat: "Katalog"
  • název: (název) povinná položka typu objekt s vlastnostmi (properties):
    • cs: nepovinná položka typu řetězec
    • en: nepovinná položka typu řetězec
  • popis: (popis) povinná položka typu objekt s vlastnostmi (properties):
    • cs: nepovinná položka typu řetězec
    • en: nepovinná položka typu řetězec
  • kontaktní_bod: (kontaktní bod) povinná položka typu
  • domovská_stránka: (domovská stránka) nepovinná položka typu řetězec (formát: iri)
  • poskytovatel: (poskytovatel) povinná položka typu řetězec (formát: iri)
  • datová_sada: (datová sada) nepovinná položka typu pole hodnot {0..*} typu řetězec (formát: iri)

Objekt Organizace

Popis Organizace, právnická osoba nebo její část.
Interpretace Organizace
objekt s vlastnostmi (properties):
  • iri: nepovinná položka typu řetězec (formát: iri)
  • typ: povinná položka typu právě jedno z následujících (oneOf):
    • konstantní hodnota "Organizace"
    • pole hodnot {0..*} typu řetězec a musí obsahovat: "Organizace"
  • jméno: (jméno) povinná položka typu objekt s vlastnostmi (properties):
    • cs: nepovinná položka typu řetězec
    • en: nepovinná položka typu řetězec
  • e-mail: (email) povinná položka typu řetězec (formát: iri)

Rozhraní lokálních katalogů

V této sekci je popis dvou možných rozhraní lokálních katalogů dat pro harvestaci záznamů do Národního katalogu dat.

Rozhraní DCAT-AP Dokumenty

Tato varianta rozhraní je určena pro instituce, které nechtějí nebo nemohou provozovat pro účely harvestace metadat o datových sadách do NKD SPARQL endpoint. Počítá se serializací metadat o datových sadách do statických souborů umístěných na web. Jako indexový soubor pak poslouží soubor obsahující instanci třídy dcat:Catalog, která pomocí vlastnosti dcat:dataset ukazuje na URL jednotlivých datových sad a datových sérií. Při přístupu na tato URL datových sad NKD předpokládá, že v odpovědi dostane kompletní katalogizační záznam pro danou datovou sadu dle příslušné OFN.

Katalog a datové sady musí být identifikovány svými IRI, nesmí se jednat o RDF blank nody.

Příklady obsahují i příslušná JSON schémata pro validaci souborů ve variantě JSON-LD.

Soubor katalogu

Soubor katalogu je soubor v RDF serializaci Turtle či JSON-LD, který obsahuje instanci třídy dcat:Catalog a odkazy na jednotlivé katalogizované datové sady.

Příklady lokálních katalogů typu DCAT-AP Dokumenty

V této sekci uvádíme příklady katalogů užívajících rozhraní DCAT-AP Dokumenty.

Aktuální příklady lze nalézt v sekci Lokální katalogy v NKD.

Rozhraní DCAT-AP SPARQL Endpoint

Toto rozhraní předpokládá, že metadata datových sad dle této specifikace jsou uložena a přístupná ve SPARQL endpointu. Obsah záznamů je identický k rozhraní DCAT-AP Dokumenty. Po registraci tohoto SPARQL endpointu se na něm NKD zeptá nejprve na seznam instancí tříd dcat:Dataset a dcat:DatasetSeries, a poté se po skupinách bude ptát na povinné, nepovinné i další položky jednotlivých datových sad dle příslušné OFN. Jedná se o nejjednodušší způsob registrace lokálního katalogu dat.

Příklady lokálních katalogů typu SPARQL endpoint

V této sekci uvádíme příklady katalogů užívajících rozhraní SPARQL endpoint.

Aktuální příklady lze nalézt v sekci Lokální katalogy v NKD.

Použité prefixy

PrefixNamespace IRI
dcathttp://www.w3.org/ns/dcat#
dcat-ap-czhttps://ofn.gov.cz/dcat-ap-cz#
dcat-aphttps://mff-uk.github.io/specifications/dcat-ap#
dcat-daphttps://mff-uk.github.io/specifications/dcat-dap#
dctermshttp://purl.org/dc/terms/
foafhttp://xmlns.com/foaf/0.1/
rdfshttp://www.w3.org/2000/01/rdf-schema#
vcardhttp://www.w3.org/2006/vcard/ns#

Přílohy

Součástí této specifikace jsou následující přílohy.

Příloha Odkaz
Aplikační profil ./dsv.ttl
SHACL validační pravidla ./shacl.ttl
JSON schéma../katalog/schéma.json
JSON-LD kontext../katalog/kontext.jsonld
Dokumentace#