Cílem tohoto dokumentu je stanovit způsob tvorby a publikace sémantického slovníku pojmů veřejné správy České republiky. Sémantický slovník pojmů je základním prostředkem pro harmonizaci sémantiky dat vedených v informačních systémech veřejné správy ČR. Dokument nejprve definuje pojem sémantický slovník pojmů a popisuje jeho vrstevnatou architekturu. Poté se detailně věnuje jednotlivým vrstvám i ve formě příkladů.
Sémantický slovník pojmů veřejné správy (SGoV) je definován v Národním architektonickém plánu v kapitole Podstata změn v datové architektuře. Je prostředkem pro postupnou harmonizaci významu (sémantiky) dat vedených v informačních systémech veřejné správy (ISVS). Lze jej chápat jako katalog odborného pojmosloví používaného v rámci veřejné správy. SGoV zahrnuje pojmy, jejich definice a vazby na legislativu, vzájemné sémantické vazby pojmů mezi sebou i sémantické vazby pojmů na standardní veřejné slovníky používané v zahraničí (především z iniciativy EU, např. ISA Core Vocabularies). SGoV je zveřejňován jako otevřená data.
SGoV je přirozenou evolucí stavu, kdy je v Registru práv a povinností veden výčet údajů vedených k agendám dle § 51 odst. 5 písm. g), h) a i) zákona č. 111/2009 Sb. o základních registrech. SGoV údaje rozpracovává do podoby strojově čitelných informačních modelů (ontologických modelů), které je možno sdílet prostřednictvím běžných principů, protokolů a technologií sítě WWW.
SGoV je budován postupným doplňováním pojmů z jednotlivých domén odpovídajících agendám a sémantických souvislostí mezi těmito pojmy jednotlivými orgány veřejné správy (OVS), které jsou ohlašovateli těchto agend. Není tedy budován centrálně, Odbor hlavního architekta eGovernmentu Ministerstva vnitra ČR (OHA) má pouze vzdělávací, poradní a koordinační roli. SGoV má vrstvenou architekturu, kde sjednocujícícm prvkem jsou první dvě horní vrstvy společné pro všechny OVS. Tyto dvě první vrstvy jsou v gesci OHA, na ostatních vrstvách jsou části odpovídající jednotlivým doménám tvořeny ohlašovateli příslušných agend, avšak ve vazbě na horní dvě vrstvy.
Pro účely harmonizace sémantiky dat vedených v ISVS jsou logická schémata popisující strojové (syntaktické) vyjádření dat vedených v ISVS propojována na pojmy SGoV. Tím je realizováno propojení sémantiky (významu) dat napříč jednotlivými ISVS. Díky tomu, že SGoV integruje údaje vedené k agendám v Registru práv a povinností dle § 51 odst. 5 písm. g), h) a i) zákona č. 111/2009 Sb. o základních registrech, které jsou legislativně ukotveny, je vazba každého pojmu SGoV na legislativu buď přímo uvedena, nebo je dohledatelná přes souvisejicí pojmy pomocí dokumentovaných vazeb. SGoV sám o sobě nezajišťuje syntaktickou ani sémantickou interoperabilitu, neboť logická schémata nejsou nutně, a zvlášť na počátku budování sémantického slovníku pojmů, propojena úplně, tj. nejsou propojeny všechny prvky logických schémat na přesný sémantický popis vyjádřený pojmy ze sémantického slovníku pojmů. SGoV je pouze harmonizačním prostředkem usnadňujícím zajišťování syntaktické a sémantické interoperability dat.
SGoV je v první řadě určen pro podporu kvalitní publikace otevřených dat ve Veřejném datovém fondu (VDF). Údaje zveřejňované jako otevřená data ve VDF musejí být opatřena publikovaným logickým schématem popisujícím strojově čitelným způsobem jejich syntaxi a strukturu. Sémanticky významné prvky logického schématu musí být propojeny strojově čitelným způsobem na pojmy SGoV a tato propojení musí být publikována jako otevřená data. Podoba propojení a způsob jejich publikace v podobě otevřených dat určuje otevřená formální norma Popis dat sémantickým slovníkem pojmů.
Následující obrázek demonstruje uvedené principy na datových sadách Agendy a Orgány veřejné moci z Registru práv a povinností.
V této kapitole jsou představeny klíčové principy sémantického slovníku pojmů, spolu s odůvodněním jejich smyslu a základními myšlenkami jejich realizace.
Název pojmu | Agenda |
Normativní odkaz | § 2 písm. e) zákona č. 111/2009 Sb. o základních registrech |
Příklad | Agenda A1136 - Registr docentů a profesorů |
Typ | https://slovník.gov.cz/základní/pojem/typ-objektu |
Specializuje pojem | https://slovník.gov.cz/veřejný-sektor/pojem/objekt-práva |
SGoV označuje soubor informačních artefaktů sloužících ke sdílení významu pojmů používaných v rámci veřejné správy České republiky. Slovník je vrstven do několika úrovní, lišících se životním cyklem odborných pojmů a rozsahem jejich využití.
Architektura SGoV vychází z úrovní popisu procesů ve veřejné správě. Legislativě definuje a používá pojmy, které jsou dále přejímány a interpretovány v popisu agend veřejné správy. Na základě této logiky architektura SGoV sestává z těchto úrovní:
Každý slovník na každé úrovni má stejnou strukturu sestávající ze 3 artefaktů:
Z-SGoV popisuje pojmosloví obecné, které není specifické pro žádnou doménu veřejné správy. Jedná se o pojmy obecné povahy jako např. Událost nebo Objekt. Pojmy Z-SGoV jsou využívány ve slovnících na nižších úrovních SGoV jako modelovací konstrukty. Definují tedy modelovací jazyk SGoV.
Obecné pojmy a jejich vzájemné vazby jsou vytvářeny na základě výsledků a metod ontologického inženýrství v oblasti základních ontologií. Z-SGoV je založen na části základních ontologií rodiny Unified Foundational Ontology (UFO). Tato rodina základních ontologických modelů popisuje klíčové oblasti znalostního popisu reálného světa. Z-SGoV přejímá a rozšiřuje některé části ontologií rodiny UFO v české verzi:
Z-SGoV je výběrem konstruktů ontologií rodiny UFO. Některé části ontologií UFO nejsou do slovníku zahrnuty, neboť by zvýšily složitost popisu, aniž by poskytly zřejmé výhody vzhledem k přepokládanému využití SGoV. V budoucnu však může být Z-SGoV podle potřeby o další části rozšířen. Z-SGoV je plně kompatibilní s ontologiemi UFO, což do budoucna zajišťuje možnost jeho dalšího rozšiřování.
Základní glosář zahrnuje popisné odborné pojmy a jejich vzájemné vazby. Klíčové pojmy a vazby jsou uvedeny v následujících odstavcích. Pojmy ze základního glosáře uvedené v této sekci jsou definovány jako ontologické kategorie identifikované v rámci tvorby ontologií rodiny UFO. Pro pojmy základního glosáře se evidují zejména:
Dále Z-GP zavádí pojmy, které reprezentují vazby mezi ostatními pojmy.
Základní ontologický model (Z-OM) popisuje vazby (souvislosti) mezi pojmy zavedené v Z-GP. Z-OM umožňuje reprezentovat objekty a jejich závislé vlastnosti/vztahy, včetně okamžitých stavů těchto objektů, vlastností a vztahů. Všechny proměnné prvky mohou být měněny, vytvářeny či destruovány událostmi, které mají časové a prostorové určení a definují jednotlivé okamžité stavy těchto proměnných prvků. Důležitou roli hrají rovněž typy samotné - proměnné prvky, které lze použít pro označování/kategorizaci jiných proměnných či neměnných prvků.
Popis znalosti typicky probíhá na 3 základních úrovních obecnosti - úroveň typů, úroveň instancí a úroveň okamžitých stavů. Příkladem na úrovni typů je Orgán veřejné moci (Typ objektu), který Má název orgánu veřejné moci (Typ vlastnosti) a Ohlašuje agendu (Typ vztahu). Příkladem na úrovni instancí je Ministerstvo vnitra jako instance typu Orgán veřejné moci. Název Ministerstva vnitra je pak instancí typu Má název orgánu veřejné moci. Příkladem instance typu Ohlašuje agendu je pak konkrétní vztah mezi Ministerstvem vnitra a konkrétní agendou, kterou Ministerstvo vnitra ohlásilo, např. agenda A1043 Veřejné sbírky. Každá z těchto instancí je proměnným prvkem, který někdy vzniknul, v čase se mění a někdy také zanikl nebo zanikne. Jejich stavy se tak v čase mohou měnit. Můžeme tak uvažovat aktuální stav každé z instancí nebo okamžitý stav k danému časovému okamžiku.
Následující obrázek zobrazuje Z-OM v podobě diagramu tříd vyjádřeném v jazyku UML. Pojmy Z-GP jsou zobrazeny jako UML třídy. Vazby mezi pojmy Z-GP jsou zobrazeny jako UML asociace. Barva zobrazení jednotlivých pojmů určuje, do jaké úrovně patří instance daného pojmu - typy (oranžová), objekty (modrá), vlastnosti/vztahy (tmavě modrá), události (světle modrá), okamžité stavy (šedá) a ostatní (černá).
Pro přesnější kategorizaci typů základní slovník zavádí hierarchii typů. Tato hierarchie je zobrazena na následujícím obrázku.
Sémantický slovník pojmů veřejného sektoru (V-SGoV) představuje konceptuální model konsensuálního pojmosloví používaného napříč veřejnou správou zejména v oblasti základních pojmů teorie práva, struktury dat a jejich evidence. Jedná se o některé společné pojmy, které nejsou legislativně ukotveny, mají však široce přijímaný význam, např. pojem Člověk, Organizace, Dokument, atp. Jednotlivé pojmy V-SGoV jsou axiomatizované pomocí pojmů a vazeb základního slovníku.
V-GP je uveden ve struktuře analogické k Z-GP.
Následující diagram znázorňuje strukturu ontologického modelu veřejného sektoru pojmů z oblasti teorie práva vyjádřenou pomocí základního slovníku. Ústředním pojmem je zde právní vztah, který vytváří vztah mezi subjekty práva a který se týká daných objektů práva. Subjektům práva jsou tímto vztahem přirazeny práva a povinnosti.
Další diagram znázorňuje vazby mezi pojmy popisujícími slovníky samotné. Ústředním pojmem je zde znalostní struktura, která je kategorizována podle typu slovníku.
Pro popis evidencí (datových sad evidujících datové položky o proměnný prvcích jediného typu) zavádíme pojem Evidenční systém, který eviduje dané proměnné prvky. Na úrovni typů je zaveden paralelní vztah je evidencí pro popisující jaké typy proměnných prvků evideční systémy daného typu popisují. Viz následující obrázek.
Strukturu právních předpisů ukazuje následující diagram. Základem je pojem Dokument reprezentující obecně jakýkoliv dokument. Rozlišujeme Bezkontextový dokument jako dokument, který je integrální a Kontextový dokument jako dokument, který je součástí jiného dokumentu. Právní předpis je potom speciálním případem bezkontextového dokumentu který sestává z částí.
Sémantický slovník pojmů legislativy (L-SGoV) představuje konceptuální model odborného pojmosloví zavedené v jednom konkrétním právním předpisu a tvoří jeho pojmoslovný rámec. Právní předpisy uvažované v této otevřené formální normě jsou zejména zákony a vyhlášky ze Sbírky zákonů ČR. Otevřená formální norma však není na typu předpisů nijak závislá a naopak předpokládá rozšiřování typů legislativních dokumentů o další normativní předpisy - evropská legislativa, vnitřní organizační předpisy, atd. Pojmy v L-SGoV jsou definovány s využitím pojmů z V-SGoV a Z-SGoV. L-SGoV může k definici svých pojmů přepoužívat pojmy z jiných L-SGoV v případech, kdy se právní předpis odkazuje na jiné odpovídající právní předpisy.
Glosář pojmů daného právního předpisu je tvořen pojmy, které jsou v daném předpise definovány či významově vymezovány, nebo které jsou v daném předpise nějakým způsobem používány. Pro každý pojem jsou v glosáři uvedeny následující údaje:
Jako příklad L-GP uvádíme vybrané pojmy zákona č. 111/2009 Sb. o základních registrech, konkrétně z části popisující registr práv a povinností. Jedná se o pojmy, které zákon explicitně definuje, popisuje nebo používá. Každý takový pojem je tedy součástí sémantického slovníku pojmů zákona č. 111/2009 o základních registrech.
Pojem reprezentuje význam platný v kontextu tohoto konkrétního zákona. Globální identita pojmu je dle principu zajištěna pomocí HTTP IRI, jehož součástí je identita slovníku zákona a pojmenování pojmu. Pojmenování pojmu vyplývá z jeho názvu. Název sám o sobě není globálním identifikátorem. Je jedinečný pouze v rámci samotného slovníku. Stejný název tak může být použit v jiných slovnících pro pojmenování jiných pojmů s jiným významem. To odpovídá situaci, kdy různé legislativní předpisy používají stejné názvy (tj. stejná slova či sekvence slov) pro označování různých významů. Příkladem je výše uvedený pojem Osoba, který nese pojmenování 'osoba'. Nereprezentuje však obecný význam, ale pouze význam platný a relevantní pouze v kontextu zákona č. 111/2009 Sb. Z definice v zákoně můžeme vidět, že pojem reprezentuje jasně vymezený okruh subjektů, o nichž se vedou údaje v registru osob. Pojmenování 'osoba' se vyskytuje v řadě jiných zákonů, např. v zákoně č. 137/2001 Sb. o zvláštní ochraně svědka a dalších osob v souvislosti s trestním řízením. Zde se však pojmenováním 'osoba' označuje zcela jiný význam a jedná se tak pouze o lingvistickou shodu v pojmenování, nikoliv však významovou, tj. sémantickou.
Ontologický model daného právního předpisu popisuje souvislosti mezi pojmy definované příslušným glosářem pojmů a souvislosti pojmů s pojmy z jiných glosářů. K popisu souvislostí využívá konstruktů zavedených v základním slovníku pojmů (Z-SGoV). Následující obrázek ukazuje ontologický model pro část glosáře zákona č. 111/2009 Sb. o základních registrech uvedeného výše.
Souvislosti zachycené v ontologickém modelu popisují sémantiku pojmů glosáře. Jsou vyjádřeny pomocí vazeb zavedených v Z-SGoV. Vazba je instancí typu určuje typ prvku. UML diagram v příkladu výše např. popisuje, že Osoba je instancí typu Typ objektu, Má identifikační číslo osoby je instancí typu Typ vlastnosti a Má datovou schránku osoby je instancí typu Typ vztahu. Jinými slovy, Osoba je typem objektu. Jeho instance jsou potom konkrétními osobami. Má identifikační číslo osoby je typem vlastnosti a jeho instance jsou vlastnosti reprezentující identifikační čísla konkrétních osob a nabývající konkrétních hodnot. Má datovou schránku osoby je typem vztahu a jeho instance jsou jednotlivé vztahy mezi konkrétními osobami a jejich datovými schránkami. V UML diagramu je přiřazení typů pojmům vyjádřeno pomocí tzv. UML stereotypů, které jsou graficky znázorněny v pravém horním rohu pojmu.
Vazba má vlastnost propojuje typ a typ vlastnosti. Specifikuje, že instance typu mají vlastnost daného typu a nabývají hodnot této vlastnosti. UML diagram např. vyjadřuje, že Osoba má vlastnost Má identifikační číslo osoby. To znamená, že prvek typu Osoba má vlastnost typu Má identifikační číslo osoby. Jinými slovy to znamená, že konkrétní osoba má své identifikační číslo osoby. Kardinalita typu vlastnosti ve vazbě omezuje možný počet hodnot vlastnosti. V případě typu vlastnosti Má identifikační číslo osoby kardinalita značí, že osoba má právě jedno identifikační číslo osoby.
Vazby CHYBA: Nepodařilo se nalézt název prvku https://slovník.gov.cz/základní/pojem/má-vztažený-prvek-1. a CHYBA: Nepodařilo se nalézt název prvku https://slovník.gov.cz/základní/pojem/má-vztažený-prvek-2. propojují typ vztahu s typy, které se vztahu účastní. Číslování určuje směr čtení vztahů. UML diagram např. vyjadřuje, že Má datovou schránku osoby CHYBA: Nepodařilo se nalézt název prvku https://slovník.gov.cz/základní/pojem/má-vztažený-prvek-1. Osoba a CHYBA: Nepodařilo se nalézt název prvku https://slovník.gov.cz/základní/pojem/má-vztažený-prvek-2. Datová schránka. To znamená, že mezi danou osobou a datovou schránkou může existovat vztah typu Má datovou schránku osoby, který přiřazuje osobě datovou schránku. Kardinalita u vazby CHYBA: Nepodařilo se nalézt název prvku https://slovník.gov.cz/základní/pojem/má-vztažený-prvek-1. (a obdobně u CHYBA: Nepodařilo se nalézt název prvku https://slovník.gov.cz/základní/pojem/má-vztažený-prvek-2.) na straně typu vztahu značí kolika různých vztahů tohoto typu se může daná instance vztaženého typu účastnit. Na straně vztaženého typu značí, kolik jeho instancí se účastní jedné instance typu vztahu. V případě Má datovou schránku osoby tak kardinality čteme následujícím způsobem. Daná osoba se může účastnit libovolného počtu vztahů (vč. žádného) typu Má datovou schránku osoby, tj. osoba je prostřednictvím Má datovou schránku osoby vztažena k různým datovým schránkám. Jeden konkrétní vztah typu Má datovou schránku osoby zahrnuje právě jednu osobu. Daná datová schránka se může účastnit právě jednoho vztahu typu Má datovou schránku osoby a jeden konkrétní vztah typu Má datovou schránku osoby zahrnuje právě jednu datovou schránku.
Má datovou schránku osoby je typickou binární asociací a pokud bychom neuvažovali proměnnost prvků (viz Proměnný prvek), pak by bylo možné tento typ vztahu modelovat jako jednoduchou binární UML asociaci. S jednoduchými binárnímu UML asociacemi si však v SGoV nevystačíme, neboť např. právní vztahy jsou složitější. Mohou vztahovat více než 2 typy, vztahu se může účastnit více než jedna instance vztaženého typu a vztah může zahrnovat i další prvky než pouze účastníky. Dále je nutné umožnit modelovat situace, kdy instance vztahu vzniká, kdy se mění a kdy zaniká. To vše SGoV umožňuje modelovat, ale budeme se tomu věnovat v jiné části.
Výše uvedený UML diagram také modeluje specializaci pojmů. Vyjadřujeme jí pomocí vazby specializuje. UML diagram např. popisuje, že Orgán veřejné moci specializuje Osoba. To znamená, že typ Orgán veřejné moci reprezentuje podmožinu instancí typu Osoba. Každý orgán veřejné moci je osobou (ve kontextu zákona č. 111/2009 Sb. samozřejmě). Jinými slovy vše, co je v modelu vyjádřeno pro Osoba platí též pro Orgán veřejné moci. Programátoři také někdy říkají, že Orgán veřejné moci "dědí" od Osoba jeho vlastnosti, vztahy atd. V UML diagramu je vazba specializuje vyjádřena šipkou s koncem ve tvaru trojúhelníku bez pozadí na straně specializovaného typu.
UML diagram výše ale přesně neodpovídá legislativnímu předpisu, jehož model vyjadřuje. Např. vztah Má datovou schránku osoby je v zákoně 111/2009 Sb. popsán v § 26 odst. 2 písm. h) zákona č. 111/2009 Sb.. Tohoto vztahu se účastní osoby a tudíž také orgány veřejné moci a soukromoprávní uživatelé údajů. Jenže § 51 odst. 1 písm. e) zákona č. 111/2009 Sb. explicitně popisuje specifičtější vztah mezi orgánem veřejné moci a datovou schránkou tohoto orgánu. Spoléhat tedy pouze na specializaci mezi Orgán veřejné moci a Osoba tak není zcela správně, protože pomíjíme § 51 odst. 1 písm. e) zákona č. 111/2009 Sb.. Pokud je tato nepřesnost problém, je řešením zavést nový typ vztahu Má datovou schránku orgánu veřejné moci vztahující Orgán veřejné moci a Datová schránka. Tento typ vztahu specializuje Má datovou schránku osoby. Tento nový typ vztahu je specifičtější už jenom v tom, že je dále ve legislativě upraven (§ 51 odst. 1 písm. e) zákona č. 111/2009 Sb.). To samé platí pro datovou schránku soukromoprávního uživatele údajů a typy vlastností přiřazené k typům objektů Orgán veřejné moci a Soukromoprávní uživatel údajů. Tyto nové specializace ukazují následující dva UML diagramy.
Sémantický slovník pojmů agendy tvoří společný pojmoslovný rámec agendy, kde agendu chápeme ve smyslu zákona č. 111/2009 Sb (viz příslušná legislativa). Je podmnožinou sémantických slovníků pojmů těch právních předpisů, které agendu definují, a může být doplněn o definice dalších pojmů a vazeb mezi pojmy, které nejsou definovány na úrovni legislativních slovníků, ale jsou z pohledu agendy důležité. Může se jednat o pojmy zavádějící zcela nové, ale v agendě důležité významy. Mohou to být také pojmy sloužící ke zjednodušení popisu agendy, nebo k integraci pojmů z jednotlivých legislativních slovníků (např. proto, že jednotlivé legislativní glosáře/ontologické modely obsahují různě identifikované pojmy se stejným významem, nebo různě identifikované pojmy s různým významem ovšem se stejným názvem pojmu, který by při využívání agendy komplikoval porozumění).
Glosář pojmů agendy je podmnožinou glosářů pojmů těch právních předpisů, které agendu definují, doplněnou o nové pojmy, které v legislativě nejsou definovány, ale jsou z pohledu agendy důležité. Např. glosáře pojmů agendy A104 - Základní registr - registr práv a povinností je tvořen glosářem pojmů zákona č. 111/2009 Sb. a doplňuje jej o další pojmy. Následující výčet obsahuje vybrané pojmy z tohoto doplnění. Podobně jako v případě L-GP, je pro pojmy v A-GP uváděn jejich název a definice. Normativní odkaz je uveden pouze v případě, že existuje normativní dokument (nelegislativního charakteru), který definuje nebo popisuje význam pojmu, nebo z něj význam pojmu nějakým jiným způsobem vyplývá. Protože ale takový dokument nemusí existovat, není uvedení normativního odkazu v případě A-GP povinné.
Ontologický model agendy popisuje souvislosti mezi pojmy definované příslušným glosářem pojmů a souvislosti pojmů s pojmy z jiných glosářů. K popisu souvislostí využívá konstruktů zavedených v základním slovníku pojmů (Z-SGoV). Následující obrázek ukazuje ontologický model pro část glosáře agendy A104 uvedenou výše. Ontologický model přiřazuje typy vlastností Má datum vzniku agendy a Má datum zániku agendy k legislativnímu pojmu Agenda. Dále specifikuje typ objektu Orgán veřejné moci nebo kategorie jako generalizaci legislativních pojmů Orgán veřejné moci a Kategorie orgánů veřejné moci.
Datovým artefaktem rozumíme Pasivní objekt, který poskytuje data. Je jím např. jedna Datová sada nebo celý Informační systém. Sémantický slovník pojmů datového artefaktu tvoří pojmy, které popisují význam dat poskytovaných artefaktem. Obsahuje pojmy ze sémantických slovníků agend, v rámci kterých je datový artefakt vytvářen, spravován či zveřejňov nebo které obsahují takové pojmy, pomocí kterých může být význam datového artefaktu popsán. Může být dále rozšířen o nové pojmy a souvislosti, které ve slovnících definovány nejsou, ale jsou pro popis jeho významu důležité.
Glosář pojmů datového artefaktu je tvořen vybranými pojmy z glosářů agend souvisejících s datovou sadou a doplňuje je o nové pojmy, které jsou potřebné pro popis významu datového artefaktu. Např. glosář datové sady Agendy je tvořen vybranými pojmy z glosáře Zákona č. 111/2009 Sb. a z glosáře agendy A104. Jeho část je uvedena v následujícím výčtu.
Pro popis významu datové sady Agendy nejsou potřebné další pojmy nad rámec pojmů definovaných v těchto dvou glosářích a proto glosář datové sady nezavádí další vlastní pojmy. Je pouze podmnožinou existujících glosářů.
Ontologický model datového artefaktu je podmnožinou ontologických modelů ze slovníků, jejichž glosáře tvoří glosář pojmů datového artefaktu a doplňuje je o sémantické vazby pojmů nově zavedených v glosáři pojmů datového artefaktu.
Sémantický slovník pojmů je vyjádřen jako propojená otevřená data. Vyjadření v podobě propojených otevřených dat je nutné, neboť ve strojově čitelné reprezentaci je nutno zaznamenat především propojení mezi jednotlivými pojmy uvnitř jednoho slovníku i napříč různými slovníky. Slovníky nejsou primárně ukládány v jednom datovém zdroji, ale publikovány na různých místech. Tato sekce ukáže reprezentaci jednotlivých částí sémantického slovníku pojmů. Spolu s modelem RDF budou využity dvě standardizované nadstavby - jazyk SKOS pro popis glosářů a jazyk OWL pro popis ontologických modelů.
V souladu s principy propojených dat a v souladu s otevřenou formální normou Propojená data jsou jednotlivé slovníky, glosáře, ontologické modely a jednotlivé jimi zaváděné pojmy identifikovány pomocí IRI. Tvar IRI vychází z obecných pravidel pro tvorbu IRI.
Jednotlivé části sémantického slovníku pojmů jsou identifikovány pomocí následujících IRI.
https://slovník.gov.cz/slovník
pro sémantický slovník pojmů jako celekhttps://slovník.gov.cz/základní/slovník
pro základní slovníkhttps://slovník.gov.cz/veřejný-sektor/slovník
pro slovník veřejného sektoruhttps://slovník.gov.cz/legislativní/sbírka/<Č>/<R>/slovník
pro legislativní slovník předpisu vydaného ve Sbírce zákonů, kde <Č>/<R >
je číslo předpisu ve Sbírce zákonů.
Příkladem je slovník zákona č. 111/2009 Sb., jehož IRI je ve tvaru https://slovník.gov.cz/legislativní/sbírka/111/2009/slovník
.
V případě, že správce slovníku využívá vlastní infrastrukturu pro správu slovníku,
může místo domény gov.cz
zvolit vlastní doménu.
https://slovník.gov.cz/agendový/<A>/slovník
pro agendový slovník agendy s číslem <A>
.
Příkladem je slovník agendy A104, jehož IRI je ve tvaru https://slovník.gov.cz/agendový/104/slovník
.
V případě, že správce slovníku využívá vlastní infrastrukturu pro správu slovníku,
může místo domény gov.cz
zvolit vlastní doménu.
https://slovník.gov.cz/datový/<D>/slovník
pro datový slovník datového artefaktu, kde <D>
je identifikátor datového artefaktu.
V případě, že správce slovníku využívá vlastní infrastrukturu pro správu slovníku,
může místo domény gov.cz
zvolit vlastní doménu.
<základ IRI slovníku>/glosář
, kde <základ IRI slovníku>/slovník
je IRI slovníku.
Např. https://slovník.gov.cz/legislativní/sbírka/111/2009/glosář
je IRI glosáře zákona č. 111/2009 Sb.
<základ IRI slovníku>/model
, kde <základ IRI slovníku>/slovník
je IRI slovníku.
Např. https://slovník.gov.cz/legislativní/sbírka/111/2009/model
je IRI glosáře zákona č. 111/2009 Sb.
<základ IRI slovníku>/pojem/<identifikátor-pojmu>
, kde <základ IRI slovníku>/slovník
je IRI slovníku a <identifikátor-pojmu>
je identifikační název pojmu.
Např. https://slovník.gov.cz/legislativní/sbírka/111/2009/pojem/orgán-veřejné-moci
je IRI pojmu Orgán veřejné moci ze sémantického slovníku pojmů zákona č. 111/2009 Sb.
Sémantický slovník pojmů je vyjádřen jako OWL ontologie sdružující slovníky na jednotlivých úrovních.
Každý ze slovníků je také OWL ontologie, která importuje další dvě OWL ontologie:
Jako příklad uvádíme sémantický slovník zákona č. 111/2009 Sb.
OWL ontologie s definicí daného sémantického slovníku, OWL ontologie s definicí glosáře včetně jeho pojmů a OWL ontologie s definicí ontologického modelu včetně všech vazeb mezi pojmy uvedenými v modelu jsou publikovány jako 3 různé datové sady. Pro každou datovou sadu musí být publikována alespoň distribuce v serializaci Turtle.
Tato sekce popisuje pravidla pro vyjádření glosářů pojmů slovníků všech úrovní. Pro jednotlivé typy slovníků pak mohou být definovat další specifická pravidla, která budou uvedena v příslušných následujících sekcích.
Vyjádření glosáře pojmů má formu OWL ontologie ve tvaru:
kde:
<IRI glosáře>
je IRI glosáře pojmů,<IRI typu znalostní struktury>
identifikuje pojem, který označuje úroveň glosáře. Rozlišujeme čtyři úrovně pomocí
následujících pojmů z V-SGoV: CHYBA: Nepodařilo se nalézt název prvku https://slovník.gov.cz/veřejný-sektor/pojem/základní-struktura., CHYBA: Nepodařilo se nalézt název prvku https://slovník.gov.cz/veřejný-sektor/pojem/struktura-veřejného-sektoru., CHYBA: Nepodařilo se nalézt název prvku https://slovník.gov.cz/veřejný-sektor/pojem/legislativní-struktura., CHYBA: Nepodařilo se nalézt název prvku https://slovník.gov.cz/veřejný-sektor/pojem/agendová-struktura. a CHYBA: Nepodařilo se nalézt název prvku https://slovník.gov.cz/veřejný-sektor/pojem/datová-struktura.,<název glosáře>
je identifikační název glosáře v češtině,<IRI glosáře 1>, ... ,<IRI glosáře n>
jsou IRI glosářů, jejichž pojmy jsou začleněny do glosáře. Využívá se v případě,
že glosář sestává z pojmů z jiných glosářů.Glosář zákona č. 111/2009 Sb. je např. vyjádřen následujícím způsobem.
Glosář agendy A104 je vyjádřen následujícím způsobem.
Pojem definovaný v glosáři pojmů je vyjádřen dle následujícího předpisu:
kde:
<IRI pojmu>
je IRI pojmu,<název pojmu>
je identifikační název pojmu v češtině unikátní v rámci glosáře,<IRI glosáře>
je IRI glosáře pojmů, ve kterém je pojem definován.Pojem Orgán veřejné moci je např. vyjádřen v Turtle syntaxi následovně.
Pojem Má název orgánu veřejné moci je vyjádřen v Turtle syntaxi následovně.
Pojem Ohlašuje agendu je vyjádřen v Turtle syntaxi následovně.
Tato sekce popisuje pravidla pro vyjádření ontologických modelů všech úrovní. Pro jednotlivé typy slovníků pak mohou být definovat další specifická pravidla, která budou uvedena v příslušných následujících sekcích.
Vyjádření ontologického modelu má formu OWL ontologie ve tvaru:
kde:
<IRI modelu>
je IRI ontologického modelu,<IRI typu znalostní struktury>
identifikuje pojem, který označuje úroveň modelu. Rozlišujeme čtyři úrovně pomocí
následujících pojmů z V-SGoV: CHYBA: Nepodařilo se nalézt název prvku https://slovník.gov.cz/veřejný-sektor/pojem/základní-struktura., CHYBA: Nepodařilo se nalézt název prvku https://slovník.gov.cz/veřejný-sektor/pojem/struktura-veřejného-sektoru., CHYBA: Nepodařilo se nalézt název prvku https://slovník.gov.cz/veřejný-sektor/pojem/legislativní-struktura., CHYBA: Nepodařilo se nalézt název prvku https://slovník.gov.cz/veřejný-sektor/pojem/agendová-struktura. a CHYBA: Nepodařilo se nalézt název prvku https://slovník.gov.cz/veřejný-sektor/pojem/datová-struktura.,<název modelu>
je identifikační název modelu v češtině,<IRI glosáře>
je IRI glosáře, nad kterým je model vytvářen.Ontologický model zákona č. 111/2009 Sb. je např. vyjádřen následujícím způsobem.
Ontologický model agendy A104 je vyjádřen následujícím způsobem.
Pojem definovaný v ontologickém modelu je vyjádřen dle následujícího předpisu:
kde:
<IRI pojmu>
je IRI pojmu,<název pojmu>
je identifikační název pojmu v češtině shodný s názvem uvedeným v glosáři,<IRI modelu>
je IRI ontologického modelu, ve kterém je pojem definován.Pojem Orgán veřejné moci je např. vyjádřen v Turtle syntaxi následovně.
Pojem Má název orgánu veřejné moci je vyjádřen v Turtle syntaxi následovně.
Pojem Ohlašuje agendu je vyjádřen v Turtle syntaxi následovně.
Pro vyjádření sémantického slovníku pojmů právního předpisu platí nad rámec obecných pravidel další specifická pravidla popsaná v této sekci.
Vyjádření glosáře pojmů právního předpisu navíc obsahuje propojení glosáře na právní předpis pomocí jeho IRI. IRI právních předpisů ještě nejsou pevně stanovena, neboť čekáme na realizaci projektu eSbírka. Tento projekt stanoví finální podobu IRI právních předpisů a tato otevřená formální norma bude odpovídajícím způsobem upravena.
kde:
<IRI glosáře>
je IRI glosáře pojmů,<IRI právního předpisu>
je IRI právního předpisu, pro nejž je glosář pojmů definován.Glosář zákona č. 111/2009 Sb. je tak doplněn následujícím způsobem.
Podobně je každý pojem definovaný glosářem pojmů legislativního předpisu doplněn o odkaz na ustanovení právního předpisu, ve kterém je pojem definován nebo nějakým jiným způsobem specifikován. Odkaz je vyjádřen následujícím způsobem.
Vyjádření pojmu Orgán veřejné moci je tak doplněno následujícím způsobem.
Vyjádření ontologického modelu právního předpisu navíc obsahuje propojení ontoogického modelu na právní předpis pomocí jeho IRI, podobně jako v případě glosáře.
kde:
<IRI modelu>
je IRI modelu,<IRI právního předpisu>
je IRI právního předpisu, pro nejž je ontologický model definován.Ontologický model zákona č. 111/2009 Sb. je tak doplněn následujícím způsobem.
Pro pojmy definuje ontologický model legislativního předpisu sémantické vazby mezi pojmy. Možné typy vazeb mezi pojmy definuje Z-SGoV. Vazby jsou vyjádřeny pomocí konstrukcí jazyka OWL následujícím způsobem.
kde:
<IRI typu 1>
je IRI pojmu, který je specializujícím typem,<IRI typu 2>
je IRI pojmu, který je specializovaným typem.kde:
<IRI pojmu>
je IRI pojmu, který je instancí,<IRI typu>
je IRI pojmu, který je instanciovaným typem.kde:
<IRI typu vlastnosti>
je IRI pojmu, který je typem vlastnosti,<IRI typu proměnného prvku>
je IRI pojmu, který je typem proměnného prvku (např. typem objekut), jehož instance
mají instance typu vlastnosti jako svoje vlastnosti.V případě typu binárního vztahu, který nemá žádnou vazbu na jiné prvky než na dva typy, jejichž instance jsou v tomto binárním vztahu, je vyjádření následující.
kde:
<IRI vztaženého typu 1>
je IRI prvního typu, jehož instance se účastní vztahu daného typu<IRI vztaženého typu 2>
je IRI druhého typu, jehož instance se účastní vztahu daného typuTento typ vztahu vždy čteme ve směru od prvního typu ke druhému.