Cílem tohoto dokumentu je specifikovat rozhraní lokálních katalogů dat (LKD) pro jejich harvestování Národním katalogem dat (NKD). Dokument je založen na základním datovém modelu pro kataolgy dat DCAT-AP-CZ. Jsou specifikovány 2 varianty rozhraní pro harvestaci, jedna využívá SPARQL endpoint a jedna specifikuje variantu uložení záznamů v souborech, bez použití SPARQL endpointu. Specifikace metadatových záznamů datových sad v katalogu jsou popsány v samostatných specifikacích dle jejich druhu.
Provozování lokálního katalogu dat (LKD) je jedním ze způsobů zajištění katalogizace dat v Národním katalogu dat (NKD). Tento způsob katalogizace je vhodný pro všechny organizace, u kterých se dá předpokládat katalogizace většího množství datových sad či častější aktualizace jejich metadat. Touto OFN je specifikován samotný lokální katalog dat a způsob jeho harvestace, nezávisle na typu obsažených datových sad. Pro specifikaci jednotlivých typů datových sad v katalogu slouží samostané OFN.
V lokálních katalozích dat poskytovatelé katalogizují dva základní typy datových sad. Každý z typů datových sad je specifikován samostatnou OFN. Aktuálně rozlišujeme dva typy datových sad.
| IRI profilovaných tříd | dcat:Catalog |
| IRI | https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#Katalog |
| Název | Katalog |
| Definice | Řízená kolekce metadat o datových sadách a datových službách |
| Hierarchie |
|
| Popis použití v profilu | A Web-based data catalog is typically represented as a single instance of this class. Datasets and data services are examples of resources in the context of a data catalog. (@en) |
| IRI profilovaných vztahů | dcat:dataset |
| IRI | https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#Katalog.datováSada |
| Název | datová sada |
| Definice | Kolekce dat, která je katalogizována v katalogu. |
| Definiční obor | Katalog |
| Obor hodnot | Datová sada [0..*] |
| Hierarchie |
|
| Popis použití v profilu | As empty Catalogues are usually indications of problems, this property should be combined with the property service to implement an empty Catalogue check. (@en) |
| IRI profilovaných vztahů | foaf:homepage |
| IRI | https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#Katalog.domovskáStránka |
| Název | domovská stránka |
| Definice | Tato vlastnost odkazuje na domovskou stránku lokálního katalogu, kam mohou chodit uživatelé. |
| Definiční obor | Katalog |
| Obor hodnot | Dokument [0..1] |
| Hierarchie |
|
| Popis použití v profilu | (@en) |
| IRI profilovaných vztahů | dcat:contactPoint |
| IRI | https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#Katalog.kontaktníBod |
| Název | kontaktní bod |
| Definice | Tato vlastnost obsahuje kontaktní informace, které mohou být využity pro zasílání připomínek ke katalogu. |
| Definiční obor | Katalog |
| Obor hodnot | Organizace [1..1] |
| Hierarchie |
|
| IRI profilovaných vztahů | dcterms:title |
| IRI | https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#Katalog.název |
| Název | název |
| Definice | Tato vlastnost obsahuje název datového katalogu. |
| Definiční obor | Katalog |
| Obor hodnot | Text [1..1] |
| Hierarchie |
|
| Popis použití v profilu | This property can be repeated for parallel language versions of the name. (@en) |
| IRI profilovaných vztahů | dcterms:description |
| IRI | https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#Katalog.popis |
| Název | popis |
| Definice | Tato vlastnost obsahuje volný text s popisem datového katalogu. |
| Definiční obor | Katalog |
| Obor hodnot | Text [1..1] |
| Hierarchie |
|
| Popis použití v profilu | This property can be repeated for parallel language versions of the description. (@en) |
| IRI profilovaných vztahů | dcterms:publisher |
| IRI | https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#Katalog.poskytovatel |
| Název | poskytovatel |
| Definice | Poskytovatel datového katalogu. |
| Definiční obor | Katalog |
| Obor hodnot | Poskytovatel [1..1] |
| Hierarchie |
|
| IRI profilovaných tříd | dcat:Dataset |
| IRI | https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#DatováSada |
| Název | Datová sada |
| Definice | Kolekce dat poskytovaná či řízená jedním zdrojem, která je k dispozici pro přístup či stažení v jednom či více formátech. |
| Hierarchie |
|
| Popis použití v profilu | If a Dataset is used as part of a Dataset Series, the usage of the properties listed below must be coherent with the associated Dataset Series. For this usage, consult the guidelines in section 14. General usage guidelines. (@en) |
Zpětné asociace
| IRI profilovaných tříd | foaf:Document |
| IRI | https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#Dokument |
| Název | Dokument |
| Definice | Textový dokument určený pro čtení lidmi. Například webová stránka. |
| Hierarchie |
|
Zpětné asociace
| IRI profilovaných tříd | rdfs:Resource |
| IRI | https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#E-mailAddress |
| Název | E-mailová adresa |
| Definice | E-mailová adresa identifikovaná pomocí mailto: IRI. |
| Hierarchie |
|
Zpětné asociace
| IRI profilovaných tříd | vcard:Organization |
| IRI | https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#Organizace |
| Název | Organizace |
| Definice | Organizace, právnická osoba nebo její část. |
| Hierarchie |
|
Zpětné asociace
| IRI profilovaných vztahů | vcard:hasEmail |
| IRI | https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#Organizace.email |
| Název | |
| Definice | E-mailová adresa pro komunikaci. |
| Definiční obor | Organizace |
| Obor hodnot | E-mailová adresa [1..1] |
| Hierarchie |
|
| IRI profilovaných vztahů | vcard:fn |
| IRI | https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#Organizace.jméno |
| Název | jméno |
| Definice | Jméno objektu jako formátovaný text. |
| Definiční obor | Organizace |
| Obor hodnot | Text [1..1] |
| Hierarchie |
|
| IRI profilovaných tříd | foaf:Agent |
| IRI | https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#Poskytovatel |
| Název | Poskytovatel |
| Definice | Poskytovatel dat |
| Hierarchie |
|
| Popis použití v profilu | If the Agent is an organisation, the use of the Organization Ontology is recommended. (@en) |
Zpětné asociace
| IRI profilovaných tříd | dcat:DatasetSeries |
| IRI | https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat#SérieDatovýchSad |
| Název | Série datových sad |
| Definice | Série datových sad zastřešuje související datové sady a jiné série. Souvislost může být časová (rozpočet v letech), prostorová (seznamy ulic v obcích) či tématická (datové sady z jednoho systému). |
| Hierarchie |
|
| Popis použití v profilu | It is recommended to avoid Dataset Series without a dataset in the collection. Therefore at least one Dataset should refer to a Dataset Series using the property in series (dcat:inSeries). (@en) |
Datová struktura pro Katalog. Řízená kolekce metadat o datových sadách a datových službách
https://ofn.gov.cz/dcat-ap-cz-rozhraní-katalogů-dat/draft/katalog/schéma.json../katalog/schéma.jsonhttps://json-schema.org/draft/2020-12/schema)| Popis | Řízená kolekce metadat o datových sadách a datových službách |
|---|---|
| Interpretace | Katalog |
properties):
iri:
povinná
položka typu
řetězec
(formát: iri)
typ:
povinná
položka typu
právě jedno z následujících (oneOf):
"Katalog"
{0..*} typu
řetězec
a musí obsahovat: "Katalog"
název:
(název)
povinná
položka typu
objekt
s vlastnostmi (properties):
cs:
nepovinná
položka typu
řetězec
en:
nepovinná
položka typu
řetězec
popis:
(popis)
povinná
položka typu
objekt
s vlastnostmi (properties):
cs:
nepovinná
položka typu
řetězec
en:
nepovinná
položka typu
řetězec
kontaktní_bod:
(kontaktní bod)
povinná
položka typu
domovská_stránka:
(domovská stránka)
nepovinná
položka typu
řetězec
(formát: iri)
poskytovatel:
(poskytovatel)
povinná
položka typu
řetězec
(formát: iri)
datová_sada:
(datová sada)
nepovinná
položka typu
pole hodnot {0..*} typu
řetězec
(formát: iri)
| Popis | Organizace, právnická osoba nebo její část. |
|---|---|
| Interpretace | Organizace |
properties):
iri:
nepovinná
položka typu
řetězec
(formát: iri)
typ:
povinná
položka typu
právě jedno z následujících (oneOf):
"Organizace"
{0..*} typu
řetězec
a musí obsahovat: "Organizace"
jméno:
(jméno)
povinná
položka typu
objekt
s vlastnostmi (properties):
cs:
nepovinná
položka typu
řetězec
en:
nepovinná
položka typu
řetězec
e-mail:
(email)
povinná
položka typu
řetězec
(formát: iri)
V této sekci je popis dvou možných rozhraní lokálních katalogů dat pro harvestaci záznamů do Národního katalogu dat.
Tato varianta rozhraní je určena pro instituce, které nechtějí nebo nemohou provozovat pro účely harvestace metadat o datových sadách do NKD SPARQL endpoint.
Počítá se serializací metadat o datových sadách do statických souborů umístěných na web.
Jako indexový soubor pak poslouží soubor obsahující instanci třídy dcat:Catalog, která pomocí vlastnosti dcat:dataset ukazuje na URL jednotlivých datových sad a datových sérií.
Při přístupu na tato URL datových sad NKD předpokládá, že v odpovědi dostane kompletní katalogizační záznam pro danou datovou sadu dle příslušné OFN.
Katalog a datové sady musí být identifikovány svými IRI, nesmí se jednat o RDF blank nody.
Příklady obsahují i příslušná JSON schémata pro validaci souborů ve variantě JSON-LD.
Soubor katalogu je soubor v RDF serializaci Turtle či JSON-LD, který obsahuje instanci třídy dcat:Catalog a odkazy na jednotlivé katalogizované datové sady.
V této sekci uvádíme příklady katalogů užívajících rozhraní DCAT-AP Dokumenty.
Aktuální příklady lze nalézt v sekci Lokální katalogy v NKD.
Toto rozhraní předpokládá, že metadata datových sad dle této specifikace jsou uložena a přístupná ve SPARQL endpointu.
Obsah záznamů je identický k rozhraní DCAT-AP Dokumenty.
Po registraci tohoto SPARQL endpointu se na něm NKD zeptá nejprve na seznam instancí tříd dcat:Dataset a dcat:DatasetSeries, a poté se po skupinách bude ptát na povinné, nepovinné i další položky jednotlivých datových sad dle příslušné OFN.
Jedná se o nejjednodušší způsob registrace lokálního katalogu dat.
V této sekci uvádíme příklady katalogů užívajících rozhraní SPARQL endpoint.
Aktuální příklady lze nalézt v sekci Lokální katalogy v NKD.
| Prefix | Namespace IRI |
|---|---|
dcat | http://www.w3.org/ns/dcat# |
dcat-ap-cz | https://ofn.gov.cz/dcat-ap-cz# |
dcat-ap | https://mff-uk.github.io/specifications/dcat-ap# |
dcat-dap | https://mff-uk.github.io/specifications/dcat-dap# |
dcterms | http://purl.org/dc/terms/ |
foaf | http://xmlns.com/foaf/0.1/ |
rdfs | http://www.w3.org/2000/01/rdf-schema# |
vcard | http://www.w3.org/2006/vcard/ns# |
Součástí této specifikace jsou následující přílohy.
| Příloha | Odkaz |
|---|---|
| Aplikační profil | ./dsv.ttl |
| SHACL validační pravidla | ./shacl.ttl |
| JSON schéma | ../katalog/schéma.json |
| JSON-LD kontext | ../katalog/kontext.jsonld |
| Dokumentace | # |