Abstrakt

Cílem tohoto dokumentu je specifikovat rozhraní lokálních katalogů otevřených dat (LKOD) pro jejich harvestování Národním katalogem otevřených dat (NKOD). Dokument je založen na základním datovém modelu pro kataolgy dat DCAT-AP-CZ. Na jeho základě jsou dodána specifika pro kontext harvestace lokálních katalogů otevřených dat do NKOD, včetně datových sad s vysokou socio-ekonomickou hodnotou, tzv. High-Value Datasets (HVDs). Poté jsou specifikovány 2 varianty rozhraní pro harvestaci, jedna využívá SPARQL endpoint a jedna specifikuje variantu uložení záznamů v souborech, bez použití SPARQL endpointu.

Úvod

Provozování lokálního katalogu otevřených dat (LKOD) je jedním ze způsobů zajištění katalogizace dat v Národním katalogu otevřených dat (NKOD). Pro otevřená data je registrace v NKOD jedna ze zákonných podmínek pro to, aby data mohla být nazývána otevřenými daty. Tento způsob katalogizace je vhodný pro všechny organizace, u kterých se dá předpokládat katalogizace většího množství datových sad či častější aktualizace jejich metadat.

Diagram datového modelu rozhraní katalogů otevřených dat
Diagram datového modelu rozhraní katalogů otevřených dat. Šedě podbarvené části jsou specifikovány číselníky. Červeně jsou zvýrazněny změny v aktuální verzi OFN.

§ 24 odst. 2 vyhlášky č. 360/2023 Sb., o dlouhodobém řízení informačních systémů veřejné správy říká: Údaje vedené v informačním systému jsou poskytovány podle otevřené formální normy pro rozhraní katalogů otevřených dat, kterou zveřejňuje Digitální a informační agentura způsobem umožňujícím dálkový přístup. Pro účely plnění tohoto paragrafu vyhlášky slouží Otevřená formální norma DCAT-AP-CZ: Specifikace pro vyhlášku č. 360/2023 Sb., o dlouhodobém řízení informačních systémů veřejné správy, nikoliv tento dokument.

Co je nového

Oproti doporučení ze 11.1.2021 jsou v této OFN následující změny:

  1. Úprava verze nadřazeného standardu z DCAT-AP 2.0.1 na DCAT-AP 3.0.0
    1. Prolinkování specifikace na DCAT-AP 3.0.0 místo DCAT 2
    2. Změna predikátu vazby je součástí pro indikaci členství v datové sérii z dct:partOf na dcat:inSeries
    3. Explicitní zavedení typu datové série a přidání JSON schématu pro datovou sérii
    4. Přidání podpory pro indikaci právního předpisu, na základě kterého datová sada vznikla. Tuto vlastnost lze použít pro indikaci, že se jedná o dynamická data, High-Value Dataset, data z veřejného registru apod.
    5. Povinnost uvádět přístupové URL na distribuci datové sady
  2. Přidání podpory pro katalogizaci datových sad s vysokou socio-ekonomickou hodnotou, tzv. High Value Datasets (HVDs).
    1. Přidání povinnosti indikace právního předpisu http://data.europa.eu/eli/reg_impl/2023/138/oj pro označení datové sady s vysokou socio-ekonomickou hodnotou (HVDs)
    2. Přidání povinnosti indikace kategorie HVD pro datové sady s vysokou socio-ekonomickou hodnotou (HVDs) a datové služby, které je zpřístupňují.
    3. Přidání povinnosti specifikovat kontaktní bod a dokumentaci datové služby zpřístupňující HVDs.
    4. Prolinkování specifikace na DCAT-AP High Value Datasets

Položky metadatového záznamu

V této sekci jsou popsány položky, které mohou být evidované v Národním katalogu otevřených dat (NKOD) pro každou datovou sadu a její distribuci. Položky se řídí standardem DCAT Application Profile for data portals in Europe Version 3.0.0 (DCAT-AP 3.0.0). Jedná se o standard založený na propojených datech, předpokládá se tedy znalost Otevřené formální normy Propojená data.

DCAT-AP 3.0.0 rozlišuje čtyři základní typy entit. Datovou sadu, její distribuci, datovou službu a datovou sérii. Metadata datové sady ji popisují bez ohledu na konkrétní reprezentaci jejích dat. Ta je popsána jako distribuce datové sady, která reprezentuje buď soubor ke stažení, nebo odkazuje na datovou službu, přes kterou jsou data k dispozici. Distribucí může mít datová sada více, lišit se ale mohou pouze formátem souboru ke stažení (např. CSV či JSON) či způsobem zpřístupnění (soubor ke stažení či datová služba). Obsahově by distribuce měly být ekvivalentní. Datová série pak reprezentuje skupinu datových sad. Jednotlivé datové sady v sérii se mohou lišit například geograficky, např. datové sady za jednotlivé obce, nebo časově, např. datové sady za jednotlivé roky. Datovou sérii však mohou tvořit například i datové sady z jednoho informačního systému. Datové série nemají vlastní distribuce.

Použité prefixy

V popisu položek a rozhraní budou použity následující prefixy slovníků.

Pro přehlednost zápisu budou použity ještě následující prefixy zkracující IRI vzorových entit.

Třída: Katalog

Jméno
Katalog
Popis
Třída reprezentující datový katalog. Odpovídá třídě dcat:Catalog.
Třída
katalog: a dcat:Catalog .

Název

Jméno
Název
Popis
Tato vlastnost obsahuje název datového katalogu. Odpovídá vlastnosti dct:title.
Vlastnost
název, dct:title
Typ
Text
Povinnost
Povinná
Příklad
katalog: dct:title "Katalog otevřených dat Ministerstva dopravy"@cs, "Open Data Catalog of the Ministry of Transport"@en .

Popis

Jméno
Popis
Popis
Tato vlastnost obsahuje volný text s popisem datového katalogu. Odpovídá vlastnosti dct:description.
Vlastnost
popis, dct:description
Typ
Text
Povinnost
Povinná
Příklad
katalog: dct:description "Otevřená data Ministerstva dopravy. Obsahuje datové sady o jízdních řádech a liniových vedeních veřejné dopravy."@cs, "Open data of the Ministry of Transport. It contains datasets regarding timetables of public transport."@en .

Poskytovatel

Jméno
Poskytovatel
Popis
Poskytovatel datového katalogu. Odpovídá vlastnosti dct:publisher.
Vlastnost
poskytovatel, dct:publisher
Typ
Pro OVM je to IRI OVM z Registru práv a povinností (RPP).
Povinnost
Povinná
Příklad
katalog: dct:publisher <https://rpp-opendata.egon.gov.cz/odrpp/zdroj/orgán-veřejné-moci/66003008> .

Kontaktní bod - jméno a email

Jméno
Kontaktní bod - jméno a email
Popis
Tato vlastnost obsahuje kontaktní informace, které mohou být využity pro zasílání připomínek ke katalogu. Odpovídá vlastnosti dcat:contactPoint.
Vlastnost
kontaktní_bod, dcat:contactPoint
Typ
Entita podtypu vcard:Kind s vlastnostmi vcard:fn a vcard:hasEmail.
Povinnost
Nepovinná
Příklad
katalog: dcat:contactPoint správce: .

správce: a vcard:Individual ;
         vcard:fn "Jan Novák"@cs ;
         vcard:hasEmail <mailto:jan.novak@organizace.cz> .

Domovská stránka

Jméno
Domovská stránka
Popis
Tato vlastnost odkazuje na domovskou stránku lokálního katalogu, kam mohou chodit uživatelé. Odpovídá vlastnosti foaf:homepage.
Vlastnost
domovská_stránka, foaf:homepage
Typ
URL webové stránky.
Povinnost
Nepovinná
Příklad
katalog: foaf:homepage <https://data.gov.cz/> .

Vazba: Datová sada

Jméno
Datová sada
Popis
Tato vlastnost odkazuje na datové sady v katalogu. Odpovídá vlastnosti dcat:dataset.
Vlastnost
datová_sada, dcat:dataset
Typ
Datová sada.
Povinnost
Povinná
Příklad
katalog: dcat:dataset sada: .

Třída: Datová sada

Jméno
Datová sada
Popis
Klíčová třída reprezentující poskytovanou informaci. Odpovídá třídě dcat:Dataset.
Třída
sada: a dcat:Dataset .

Název

Jméno
Název
Popis
Tato vlastnost obsahuje název datové sady. Odpovídá vlastnosti dct:title.
Vlastnost
název, dct:title
Typ
Text
Povinnost
Povinná
Příklad
sada: dct:title "Kontroly plnění povinností zaměstnavatelů v oblasti sociálního zabezpečení"@cs, "Duty fulfillment inspections in the area of social security"@en .

Popis

Jméno
Popis
Popis
Tato vlastnost obsahuje volný text s popisem datové sady. Odpovídá vlastnosti dct:description.
Vlastnost
popis, dct:description
Typ
Text
Povinnost
Povinná
Příklad
sada: dct:description "Statistika kontrol plnění povinností zaměstnavatelů v oblasti sociálního zabezpečení od roku 2009"@cs, "Social security statistics for 2009"@en .

Poskytovatel

Jméno
Poskytovatel
Popis
Poskytovatel datové sady. Odpovídá vlastnosti dct:publisher.
Vlastnost
poskytovatel, dct:publisher
Typ
IRI OVM z Registru práv a povinností (RPP).
Povinnost
Povinná
Příklad
sada: dct:publisher <https://rpp-opendata.egon.gov.cz/odrpp/zdroj/orgán-veřejné-moci/66003008> .

Téma

Jméno
Téma
Popis
Tato vlastnost odkazuje na kategorii či téma datové sady. Datová sada může být popsána více tématy. Odpovídá vlastnosti dcat:theme. Dle DCAT-AP 3.0.0 musí být alespoň jedno téma z evropského číselníku datových témat.
Vlastnost
téma, dcat:theme
Typ
Několik IRI.
Povinnost
Povinná
Příklad
sada: dcat:theme <http://publications.europa.eu/resource/authority/data-theme/TRAN> .

Periodicita aktualizace

Jméno
Periodicita aktualizace
Popis
Tato vlastnost odkazuje na frekvenci, se kterou je datová sada aktualizována. Odpovídá vlastnosti dct:accrualPeriodicity. Dle DCAT-AP 3.0.0 jsou hodnoty z evropského číselníku frekvencí.
Vlastnost
periodicita_aktualizace, dct:accrualPeriodicity
Typ
IRI položky z evropského číselníku frekvencí
Povinnost
Povinná
Příklad
sada: dct:accrualPeriodicity <http://publications.europa.eu/resource/authority/frequency/MONTHLY> .

Klíčová slova

Jméno
Klíčová slova
Popis
Tato vlastnost obsahuje klíčové slovo nebo značku popisující datovou sadu. Odpovídá vlastnosti dcat:keyword.
Vlastnost
klíčové_slovo, dcat:keyword
Typ
Text, opakovaná vlastnost.
Povinnost
Povinná
Příklad
sada: dcat:keyword "kontrola"@cs, "statistika"@cs, "inspection"@en, "statistics"@en .

Související geografické území - prvek z RÚIAN

Jméno
Související geografické území - prvek z RÚIAN
Popis
Tato vlastnost odkazuje na územní prvek RÚIAN pokrytý datovou sadou. Datová sada může pokrývat více územních prvků RÚIAN. Odpovídá vlastnosti dct:spatial.
Vlastnost
prvek_rúian, dct:spatial
Typ
IRI územního prvku RÚIAN
Povinnost
Povinná
Příklad
sada: dct:spatial <https://linked.cuzk.cz/resource/ruian/stat/1> .

Související geografické území

Jméno
Související geografické území
Popis
Tato vlastnost odkazuje na geografickou oblast pokrytou datovou sadou. Datová sada může být popsána více geografickými oblastmi. Odpovídá vlastnosti dct:spatial.
Vlastnost
geografické_území, dct:spatial
Typ
IRI položek z evropských číselníků zemí, kontinentů, míst nebo IRI objektu z Geonames.
Povinnost
Nepovinná
Příklady
sada: dct:spatial <http://publications.europa.eu/resource/authority/continent/EUROPE> .
sada: dct:spatial <https://sws.geonames.org/6290257/> .

Časové pokrytí

Jméno
Časové pokrytí
Popis
Tato vlastnost odkazuje na časový úsek pokrytý datovou sadou. Odpovídá vlastnosti dct:temporal.
Vlastnost
časové_pokrytí, dct:temporal
Typ
dct:PeriodOfTime s vlastnostmi dcat:startDate a dcat:endDate, které mají datový typ xsd:date.
Povinnost
Nepovinná
Příklad
sada: dct:temporal čas: .

čas: dcat:startDate "2009-01-01"^^xsd:date ;
     dcat:endDate "2017-12-31"^^xsd:date .

Kontaktní bod - jméno a email

Jméno
Kontaktní bod - jméno a email
Popis
Tato vlastnost obsahuje kontaktní informace, které mohou být využity pro zasílání připomínek k datové sadě. Odpovídá vlastnosti dcat:contactPoint.
Vlastnost
kontaktní_bod, dcat:contactPoint
Typ
Entita podtypu vcard:Kind s vlastnostmi vcard:fn a vcard:hasEmail.
Povinnost
Nepovinná
Příklad
sada: dcat:contactPoint kontakt: .

kontakt: a vcard:Individual ;
         vcard:fn "Jan Novák"@cs ;
         vcard:hasEmail <mailto:jan.novak@organizace.cz> .

Odkaz na dokumentaci

Jméno
Odkaz na dokumentaci
Popis
Tato vlastnost odkazuje na stránku nebo dokument o datové sadě. Odpovídá vlastnosti foaf:page.
Vlastnost
dokumentace, foaf:page
Typ
URL webové stránky dokumentace.
Povinnost
Nepovinná
Příklad
sada: foaf:page <https://data.cssz.cz/documentation/kontroly-plneni-povinnosti-zamestnavatelu-v-oblasti-socialniho-zabezpeceni> .

Odkaz na specifikaci

Jméno
Odkaz na specifikaci
Popis
Tato vlastnost odkazuje na specifikaci, jíž se datová sada řídí. Takovou specifikací jsou zejména Otevřené formální normy. Odpovídá vlastnosti dct:conformsTo.
Vlastnost
specifikace, dct:conformsTo
Typ
URL specifikace.
Povinnost
Nepovinná
Příklad
sada: dct:conformsTo <https://ofn.gov.cz/turistické-cíle/2020-07-01/> .

Klasifikace dle EuroVoc

Jméno
Klasifikace dle EuroVoc
Popis
Tato vlastnost odkazuje na kategorii či téma datové sady dle EuroVoc. Datová sada může být popsána více tématy. Odpovídá vlastnosti dcat:theme.
Vlastnost
koncept_euroVoc, dcat:theme
Typ
IRI konceptu z evropského tezauru EuroVoc
Povinnost
Nepovinná
Příklad
sada: dcat:theme <http://eurovoc.europa.eu/1001>, <http://eurovoc.europa.eu/4050> .

Prostorové rozlišení v metrech

Jméno
Prostorové rozlišení v metrech
Popis
Tato vlastnost určuje prostorové rozlišení dat v datové sadě v metrech. Jedná se o nejmenší prostorový rozdíl v datové sadě. Odpovídá vlastnosti dcat:spatialResolutionInMeters.
Vlastnost
prostorové_rozlišení_v_metrech, dcat:spatialResolutionInMeters
Typ
Desetinné číslo
Povinnost
Nepovinná
Příklad
"0.5"

Časové rozlišení

Jméno
Časové rozlišení
Popis
Tato vlastnost určuje časové rozlišení dat v datové sadě. Jedná se o nejmenší časový rozdíl v datové sadě. Odpovídá vlastnosti dcat:temporalResolution.
Vlastnost
časové_rozlišení, dcat:temporalResolution
Typ
xsd:duration
Povinnost
Nepovinná
Příklad
P1D

Příslušný právní předpis

Jméno
Příslušný právní předpis
Popis
Tato vlastnost se používá pro indikaci příslušného právního předpisu předepisujícího vznik datové sady. Odpovídá vlastnosti dcatap:applicableLegislation.
Vlastnost
právní_předpis, dcatap:applicableLegislation
Typ
IRI příslušného právního předpisu ve formátu ELI.
Povinnost
Nepovinná.
Příklad
  • Pro označení HVDs: http://data.europa.eu/eli/reg_impl/2023/138/oj
  • Pro označení otevřených dat: http://data.europa.eu/eli/dir/2019/1024/oj
  • Pro označení datových sad inventárního seznamu dle DGA: http://data.europa.eu/eli/reg/2022/868/oj
  • Pro označení dynamických dat: https://www.e-sbirka.cz/eli/cz/sb/1999/106/2024-01-01/dokument/norma/cast_1/par_3a/odst_6
  • Pro označení dat z veřejných registrů dle § 5a odst. 1 zákona č. 106/1999 Sb.: https://www.e-sbirka.cz/eli/cz/sb/1999/106/2024-01-01/dokument/norma/cast_1/par_5a/odst_1

Vazba: Je součástí

Jméno
Je součástí
Popis
Tato vlastnost odkazuje na datovou sérii, jejíž je tato datová sada součástí. Odpovídá vlastnosti dcat:inSeries.
Vlastnost
je_součástí, dcat:inSeries
Typ
IRI entity typu Datové série.
Povinnost
Povinná pro datové sady v datové sérii.
Příklady
sada: dcat:inSeries <https://datový.katalog.cz/zdroj/datové-sady/série1> .

Vazba: Distribuce datové sady

Jméno
Distribuce datové sady
Popis
Tato vlastnost odkazuje z datové sady na její distribuci. Odpovídá vlastnosti dcat:distribution.
Vlastnost
distribuce, dcat:distribution
Typ
Distribuce datové sady.
Povinnost
Povinná, pokud se nejedná o zastřešující datovou sadu datové série.
Příklad
sada: dcat:distribution distribuce: .

Třída: Distribuce datové sady

Jméno
Distribuce datové sady
Popis
Fyzická podoba datové sady v konkrétním formátu nebo jako konkrétní služba, nikdy obojí. Odpovídá třídě dcat:Distribution.
Třída
distribuce: a dcat:Distribution.

Specifikace podmínek užití

Jméno
Specifikace podmínek užití
Popis
Tato vlastnost odkazuje na strukturovaný popis podmínek užití této distribuce datové sady. Hodnoty se řídí návodem na stanovení podmínek užití.
Vlastnost
podmínky_užití, pu:specifikace
Typ
pu:Specifikace s vlastnostmi pu:autorské-dílo, pu:databáze-jako-autorské-dílo, pu:databáze-chráněná-zvláštními-právy a pu:osobní-údaje.
Povinnost
Povinná
Příklad
distribuce: pu:specifikace podmínky: .

podmínky: a pu:Specifikace ;
          pu:autorské-dílo <https://data.gov.cz/podmínky-užití/neobsahuje-autorská-díla/> ;
          pu:databáze-jako-autorské-dílo <https://data.gov.cz/podmínky-užití/není-autorskoprávně-chráněnou-databází/> ;
          pu:databáze-chráněná-zvláštními-právy <https://data.gov.cz/podmínky-užití/není-chráněna-zvláštním-právem-pořizovatele-databáze/> ;
          pu:osobní-údaje <https://data.gov.cz/podmínky-užití/neobsahuje-osobní-údaje/> .

Přístupové URL

Jméno
Přístupové URL
Popis
Tato vlastnost obsahuje URL, pomocí kterého se lze dostat k distribuci datové sady. Odpovídá vlastnosti dcat:accessURL. Pro účely katalogů otevřených dat v ČR je hodnota této vlastnosti buďto stejná jako odkaz na stažení souboru v případě distribuce reprezentující soubor ke stažení, nebo stejná jako přístupový bod v případě distribuce reprezentující datovou službu.
Vlastnost
přístupové_url, dcat:accessURL
Typ
Přístupové URL distribuce datové sady.
Povinnost
Povinná
Příklad
distribuce: dcat:accessURL <https://data.cssz.cz/dump/kontroly-plneni-povinnosti-zamestnavatelu-v-oblasti-socialniho-zabezpeceni.csv> .

Příslušný právní předpis

Jméno
Příslušný právní předpis
Popis
Tato vlastnost se používá pro indikaci příslušného právního předpisu předepisujícího vznik distribuce datové sady. Odpovídá vlastnosti dcatap:applicableLegislation.
Vlastnost
právní_předpis, dcatap:applicableLegislation
Typ
IRI příslušného právního předpisu ve formátu ELI.
Povinnost
Nepovinná
Příklad
  • Pro označení HVDs: http://data.europa.eu/eli/reg_impl/2023/138/oj
  • Pro označení otevřených dat: http://data.europa.eu/eli/dir/2019/1024/oj
  • Pro označení datových sad inventárního seznamu dle DGA: http://data.europa.eu/eli/reg/2022/868/oj
  • Pro označení dynamických dat: https://www.e-sbirka.cz/eli/cz/sb/1999/106/2024-01-01/dokument/norma/cast_1/par_3a/odst_6
  • Pro označení dat z veřejných registrů dle § 5a odst. 1 zákona č. 106/1999 Sb.: https://www.e-sbirka.cz/eli/cz/sb/1999/106/2024-01-01/dokument/norma/cast_1/par_5a/odst_1

Název distribuce datové sady

Jméno
Název distribuce datové sady
Popis
Tato vlastnost obsahuje název distribuce. Odpovídá vlastnosti dct:title.
Vlastnost
název, dct:title
Typ
Text
Povinnost
Nepovinná
Příklad
distribuce: dct:title "Kontroly plnění povinností zaměstnavatelů v oblasti sociálního zabezpečení v CSV."@cs, "CSV representation of inspections in the area of social security."@en .

Třída: Distribuce - Soubor ke stažení

Jedná se o variantu třídy Distribuce pro reprezentaci souboru ke stažení. Následující položky se používají navíc k těm společným pro všechny distribuce.

Jméno
Distribuce datové sady - Soubor ke stažení
Popis
Fyzická podoba datové sady v konkrétním formátu. Odpovídá třídě dcat:Distribution.
Třída
distribuce: a dcat:Distribution.

Odkaz na stažení souboru

Jméno
Odkaz na stažení souboru
Popis
Tato vlastnost obsahuje URL, které je přímým odkazem na stažitelný soubor v daném formátu. Odpovídá vlastnosti dcat:downloadURL.
Vlastnost
soubor_ke_stažení, dcat:downloadURL
Typ
URL souboru ke stažení.
Povinnost
Povinná
Příklad
distribuce: dcat:downloadURL <https://data.cssz.cz/dump/kontroly-plneni-povinnosti-zamestnavatelu-v-oblasti-socialniho-zabezpeceni.csv> .

Formát souboru ke stažení

Jméno
Formát souboru ke stažení
Popis
Tato vlastnost odkazuje na typ souboru s distribucí. Odpovídá vlastnosti dct:format. Dle DCAT-AP 3.0.0 jsou hodnoty z evropského číselníku typů souboru.
Vlastnost
formát, dct:format
Typ
IRI položky z evropského číselníku typů souboru
Povinnost
Povinná
Příklad
distribuce: dct:format <http://publications.europa.eu/resource/authority/file-type/CSV> .

Media type souboru ke stažení

Jméno
Media type souboru ke stažení
Popis
Tato vlastnost odkazuje na typ média distribuce tak, jak je definováno v oficiálním rejstříku typů médií spravovaném IANA [[!IANA-MEDIA-TYPES]]. Odpovídá vlastnosti dcat:mediaType.
Vlastnost
typ_média, dcat:mediaType
Typ
IRI Media type z rejstříku IANA.
Povinnost
Povinná
Příklad
distribuce: dcat:mediaType <http://www.iana.org/assignments/media-types/text/csv> .

Odkaz na strojově čitelné schéma souboru ke stažení

Jméno
Odkaz na strojově čitelné schéma souboru ke stažení
Popis
Tato vlastnost odkazuje na ustanovené schéma, jímž se popisovaná distribuce řídí. Odpovídá vlastnosti dct:conformsTo.
Vlastnost
schéma, dct:conformsTo
Typ
URL schématu.
Povinnost
Nepovinná
Příklad
distribuce: dct:conformsTo <https://data.cssz.cz/dump/kontroly-plneni-povinnosti-zamestnavatelu-v-oblasti-socialniho-zabezpeceni-schema.json> .

Media type kompresního formátu

Jméno
Media type použitého kompresního formátu souboru ke stažení
Popis
Tato vlastnost odkazuje na media typ kompresního formátu souboru ke stažení tak, jak je definováno v oficiálním rejstříku typů médií spravovaném IANA [[!IANA-MEDIA-TYPES]]. Kompresní formát určuje techniku použitou ke zmenšení velikosti jednoho souboru ke stažení. Odpovídá vlastnosti dcat:compressFormat.
Vlastnost
typ_média_komprese, dcat:compressFormat
Typ
IRI Media type z rejstříku IANA.
Povinnost
Nepovinná
Příklad
distribuce: dcat:compressFormat <http://www.iana.org/assignments/media-types/application/zip> .

Media type balíčkovacího formátu

Jméno
Media type použitého balíčkovacího formátu souboru ke stažení
Popis
Tato vlastnost odkazuje na media typ balíčkovacího formátu souboru ke stažení tak, jak je definováno v oficiálním rejstříku typů médií spravovaném IANA [[!IANA-MEDIA-TYPES]]. Balíčkovací formát určuje techniku použitou k zabalení více souborů do jednoho. Odpovídá vlastnosti dcat:packageFormat.
Vlastnost
typ_média_balíčku, dcat:packageFormat
Typ
IRI Media type z rejstříku IANA.
Povinnost
Nepovinná
Příklad
distribuce: dcat:packageFormat <http://www.iana.org/assignments/media-types/application/zip> .

Třída: Distribuce - Datová služba

Jedná se o variantu třídy Distribuce pro reprezentaci distribuce pomocí datové služby. Následující položky se používají navíc k těm společným pro všechny distribuce.

Jméno
Distribuce datové sady
Popis
Fyzická podoba datové sady jako konkrétní datová služba. Odpovídá třídě dcat:Distribution.
Třída
distribuce: a dcat:Distribution.

Vazba: Přístupová služba

Jméno
Přístupová služba
Popis
Datová služba zpřístupňující distribuci datové sady. Odpovídá vlastnosti dcat:accessService.
Vlastnost
přístupová_služba, dcat:accessService
Typ
Datová služba
Povinnost
Povinná
Příklad
distribuce: dcat:accessService služba: .

Třída: Datová služba

Jméno
Datová služba
Popis
Třída reprezentující datovou službu zpřístupňující data datové sady. Odpovídá třídě dcat:DataService.
Třída
služba: a dcat:DataService .

Název

Jméno
Název
Popis
Tato vlastnost obsahuje název datové služby. Odpovídá vlastnosti dct:title.
Vlastnost
název, dct:title
Typ
Text
Povinnost
Povinná
Příklad
služba: dct:title "SPARQL endpoint České správy sociálního zabezpečení"@cs, "Czech Social Security Administration SPARQL endpoint"@en .

Přístupový bod

Jméno
Přístupový bod
Popis
Tato vlastnost obsahuje URL přístupového bodu datové služby. Odpovídá vlastnosti dcat:endpointURL.
Vlastnost
přístupový_bod, dcat:endpointURL
Typ
URL
Povinnost
Povinná
Příklad
https://data.cssz.cz/sparql

Příslušný právní předpis

Jméno
Příslušný právní předpis
Popis
Tato vlastnost se používá pro indikaci příslušného právního předpisu předepisujícího vznik datové služby zpřístupňující datovou sadu. Odpovídá vlastnosti dcatap:applicableLegislation.
Vlastnost
právní_předpis, dcatap:applicableLegislation
Typ
IRI příslušného právního předpisu ve formátu ELI.
Povinnost
Nepovinná
Příklad
  • Pro označení datové služby zpřístupňující HVDs: http://data.europa.eu/eli/reg_impl/2023/138/oj
  • Pro označení datové služby zpřístupňující otevřená data: http://data.europa.eu/eli/dir/2019/1024/oj
  • Pro označení datové služby zpřístupňující dynamická data: https://www.e-sbirka.cz/eli/cz/sb/1999/106/2024-01-01/dokument/norma/cast_1/par_3a/odst_6
  • Pro označení datové služby zpřístupňující data z veřejných registrů dle § 5a odst. 1 zákona č. 106/1999 Sb.: https://www.e-sbirka.cz/eli/cz/sb/1999/106/2024-01-01/dokument/norma/cast_1/par_5a/odst_1

Odkaz na specifikaci

Jméno
Odkaz na specifikaci
Popis
Tato vlastnost odkazuje na specifikaci, jíž se datová služba řídí. Takovou specifikací je například SPARQL. Seznam možných hodnot lze nalézt například v seznamu udržovaném Open Source Geospatial Foundation. Odpovídá vlastnosti dct:conformsTo.
Vlastnost
specifikace, dct:conformsTo
Typ
URL specifikace.
Povinnost
Nepovinná
Příklad
služba: dct:conformsTo <https://www.w3.org/TR/sparql11-protocol/> .

Odkaz na dokumentaci

Jméno
Odkaz na dokumentaci
Popis
Tato vlastnost odkazuje na dokumentaci dále popisující datovou službu. Odpovídá vlastnosti foaf:page.
Vlastnost
dokumentace, foaf:page
Typ
URL dokumentace.
Povinnost
Nepovinná
Příklad
služba: foaf:page <https://www.data.cz/služba/dokumentace> .

Popis přístupového bodu

Jméno
Popis přístupového bodu
Popis
Tato vlastnost obsahuje URL popisu přístupového bodu datové služby. Odpovídá vlastnosti dcat:endpointDescription.
Vlastnost
popis_přístupového_bodu, dcat:endpointDescription
Typ
URL
Povinnost
Nepovinná
Příklad
https://data.cssz.cz/sparql

Třída: Datová série

Datová série zastřešuje související datové sady a série. Souvislost může být časová (rozpočet v letech), prostorová (seznamy ulic v obcích) či tématická (datové sady z jednoho systému). Datová série je podtřídou Datové sady, ale nemá vlastní distribuce. Související DCAT-AP issue o typech datových sérií.

Jméno
Datová série
Popis
Třída reprezentující datovou sérii. Odpovídá třídě dcat:DatasetSeries.
Třída
série: a dcat:DatasetSeries .

Datové sady s vysokou socio-ekonomickou hodnotou (HVDs)

Tato sekce popisuje další položky a povinnosti, které se týkají pouze datových sad s vysokou socio-ekonomickou hodnotou, tzv. High Value Datasets (HVDs). Toto rozšíření je založeno na evropském standardu DCAT-AP High Value Datasets a zavádí položky nutné pro soulad s prováděcím nařízením HVD.

Součástí požadavků prováděcího nařízení HVD jsou i kvalitativní požadavky na metadatové záznamy. Ty zahrnují mj. perzistenci použitých identifikátorů (IRI) datových sad, datových služeb, podmínek užití, koncových bodů služeb. Detailní informace viz sekce 10 v DCAT-AP HVD, zejména pak sekce 10.4.

Diagram rozšíření datového modelu pro datové sady s vysokou soci-ekonomickou hodnotou (HVDs)
Diagram rozšíření datového modelu pro datové sady s vysokou soci-ekonomickou hodnotou (HVDs). Šedě podbarvené části jsou specifikovány číselníky. Červeně jsou zvýrazněny změny v aktuální verzi OFN.

Třída: Datová sada HVD

Jméno
Datová sada
Popis
Datová sada s vysokou socio-ekonomickou hodnotou (HVD).
Třída
sada: a dcat:Dataset .

Příslušný právní předpis

Jméno
Příslušný právní předpis
Popis
Tato vlastnost se používá pro indikaci, že jde o datovou sadu s vysokou socio-ekonomickou hodnotou (HVD).
Vlastnost
právní_předpis, dcatap:applicableLegislation
Typ
Konstantní IRI http://data.europa.eu/eli/reg_impl/2023/138/oj
Povinnost
Povinná.

Kategorie HVD

V červnu 2024 rozšířil Úřad pro publikace Evropské unie použitý číselník o všechna témata datových sad uvedených v prováděcím nařízení HVD. Je třeba používat co nejdetailnější kategorii, např. http://data.europa.eu/bna/c_1e787364 pro "Referenční údaje pro vodočty, které jsou důležité pro plavbu", nikoliv pouze http://data.europa.eu/bna/c_b79e35eb pro Mobilitu.

Jméno
Kategorie HVD
Popis
Tato vlastnost se používá pro indikaci kategorií datové sady s vysokou socio-ekonomickou hodnotou (high-value dataset - HVD). Odpovídá vlastnosti dcatap:hvdCategory.
Vlastnost
kategorie_hvd, dcatap:hvdCategory
Typ
IRI položek z evropského číselníku kategorií HVD.
Povinnost
Povinná
Příklad
http://data.europa.eu/bna/c_1e787364

Vazba: Distribuce datové sady HVD

Jméno
Distribuce datové sady
Popis
Vlastnost
distribuce, dcat:distribution
Typ
Distribuce datové sady HVD.
Povinnost
Povinná. Datová sada HVDs musí obsahovat alespoň jednu distribuci splňující povinné položky HVD. Může však obsahovat i jiné distribuce.

Třída: Distribuce datové sady HVD

Příslušný právní předpis

Jméno
Příslušný právní předpis
Popis
Tato vlastnost se používá pro indikaci, že jde o distribuci datové sady s vysokou socio-ekonomickou hodnotou (HVD).
Vlastnost
právní_předpis, dcatap:applicableLegislation
Typ
Konstantní IRI http://data.europa.eu/eli/reg_impl/2023/138/oj
Povinnost
Povinná

Třída: Datová služba

Jméno
Datová služba
Popis
Třída reprezentující datovou službu zpřístupňující data datové sady HVD. Odpovídá třídě dcat:DataService.
Třída
služba: a dcat:DataService .

Příslušný právní předpis

Jméno
Příslušný právní předpis
Popis
Tato vlastnost se používá pro indikaci, že se jedná o datovou službu zpřístupňující datovou sadu s vysokou socio-ekonomickou hodnotou (high-value dataset - HVD).
Vlastnost
právní_předpis, dcatap:applicableLegislation
Typ
Konstantní IRI http://data.europa.eu/eli/reg_impl/2023/138/oj
Povinnost
Povinná

Kategorie HVD

V červnu 2024 rozšířil Úřad pro publikace Evropské unie použitý číselník o všechna témata datových sad uvedených v prováděcím nařízení HVD. Je třeba používat co nejdetailnější kategorii, např. http://data.europa.eu/bna/c_1e787364 pro "Referenční údaje pro vodočty, které jsou důležité pro plavbu", nikoliv pouze http://data.europa.eu/bna/c_b79e35eb pro Mobilitu.

Jméno
Kategorie HVD
Popis
Tato vlastnost se používá pro indikaci kategorií datové služby s vysokou socio-ekonomickou hodnotou (high-value dataset - HVD). Odpovídá vlastnosti dcatap:hvdCategory.
Vlastnost
kategorie_hvd, dcatap:hvdCategory
Typ
IRI položek z evropského číselníku kategorií HVD.
Povinnost
Povinná pro datové služby poskytující datové sady s vysokou socio-ekonomickou hodnotou (high-value dataset - HVD).
Příklad
http://data.europa.eu/bna/c_1e787364

Kontaktní bod - jméno a email

Jméno
Kontaktní bod - jméno a email
Popis
Tato vlastnost obsahuje kontaktní informace, které mohou být využity pro zasílání připomínek k datové službě. Odpovídá vlastnosti dcat:contactPoint.
Vlastnost
kontaktní_bod, dcat:contactPoint
Typ
Entita podtypu vcard:Kind s vlastnostmi vcard:fn a vcard:hasEmail.
Povinnost
Povinná
Příklad
služba: dcat:contactPoint správce: .

    správce: a vcard:Individual ;
        vcard:fn "Jan Novák"@cs ;
        vcard:hasEmail <mailto:jan.novak@organizace.cz> .

Odkaz na dokumentaci

Jméno
Odkaz na dokumentaci
Popis
Tato vlastnost odkazuje na dokumentaci kvality služby zpřístupňující datovou sadu HVD. Odpovídá vlastnosti foaf:page.
Vlastnost
dokumentace, foaf:page
Typ
URL dokumentace.
Povinnost
Povinná
Příklad
služba: foaf:page <https://www.data.cz/služba/dokumentace> .

Rozhraní lokálních katalogů

V této sekci je popis dvou možných rozhraní lokálních katalogů otevřených dat pro harvestaci záznamů do Národního katalogu otevřených dat.

Rozhraní DCAT-AP Dokumenty

Tato varianta rozhraní je určena pro instituce, které nechtějí nebo nemohou provozovat pro účely harvestace metadat o datových sadách do NKOD SPARQL endpoint. Počítá se serializací metadat o datových sadách do statických souborů umístěných na web. Jako indexový soubor pak poslouží soubor obsahující instanci třídy dcat:Catalog, která pomocí vlastnosti dcat:dataset ukazuje na URL jednotlivých datových sad a datových sérií. Při přístupu na tato URL datových sad NKOD předpokládá, že v odpovědi dostane kompletní katalogizační záznam pro danou datovou sadu či sérii, včetně jejích distribucí a datových služeb.

Datové sady, datové série, distribuce a datové služby musí být identifikovány svými IRI, nesmí se jednat o RDF blank nody.

Příklady obsahují i příslušná JSON schémata pro validaci souborů ve variantě JSON-LD.

Soubor katalogu

Soubor katalogu je soubor v RDF serializaci Turtle či JSON-LD, který obsahuje instanci třídy dcat:Catalog a odkazy na jednotlivé katalogizované datové sady.

Soubor datové sady

Na URL specifikovaných v souboru katalogu pak NKOD očekává soubory v RDF serializaci Turtle či JSON-LD obsahující kompletní metadatový záznam datové sady, včetně distribucí.

Soubor datové série a datové sady v sérii

Na URL specifikovaných v souboru katalogu pak NKOD očekává soubory v RDF serializaci Turtle či JSON-LD obsahující kompletní metadatový záznam datové sady nebo datové série. Datová sada v sérii ukazuje na URL datové série pomocí dcat:inSeries (RDF Turtle) či je_součástí (JSON-LD).

Soubor datové sady HVD

Na URL specifikovaných v souboru katalogu pak NKOD očekává soubory v RDF serializaci Turtle či JSON-LD obsahující kompletní metadatový záznam datové sady, včetně distribucí. Pro HVD je třeba specifikovat nejen že na datovou sadu se vztahuje prováděcí nařízení HVD, ale i na které její distribuce a datové služby, jelikož to nemusí být na všechny. V každém případě je to indikováno pomocí hodnoty dcatap:applicableLegislation (RDF Turtle) či právní_předpis (JSON-LD) s hodnotou http://data.europa.eu/eli/reg_impl/2023/138/oj.

Příklady lokálních katalogů typu DCAT-AP Dokumenty

V této sekci uvádíme příklady katalogů užívajících rozhraní DCAT-AP Dokumenty.

Aktuální příklady lze nalézt v sekci Lokální katalogy v NKOD.

Rozhraní DCAT-AP SPARQL Endpoint

Toto rozhraní předpokládá, že metadata datových sad dle této specifikace jsou uložena a přístupná ve SPARQL endpointu. Obsah záznamů je identický k rozhraní DCAT-AP Dokumenty. Po registraci tohoto SPARQL endpointu se na něm NKOD zeptá nejprve na seznam instancí tříd dcat:Dataset a dcat:DatasetSeries, a poté se po skupinách bude ptát na povinné, nepovinné i další položky jednotlivých datových sad dle této specifikace a specifikace DCAT-AP 3.0.0. Jedná se o nejjednodušší způsob registrace lokálního katalogu otevřených dat.

Datové sady, distribuce a datové služby musí být identifikovány svými IRI, nesmí se jednat o RDF blank nody.

Příklady lokálních katalogů typu SPARQL endpoint

V této sekci uvádíme příklady katalogů užívajících rozhraní SPARQL endpoint.

Aktuální příklady lze nalézt v sekci Lokální katalogy v NKOD.