Úvod do geografických informačních systémů (GIS)
Rozdělení GIS podle provázání prostorových a atributových dat
Studijní článek: Generace GIS
Vztah mezi prostorovou a popisnou složkou
U GIS je velice podstatné provázání grafických (prostorových) a negrafických (popisných) údajů. Podle způsobu svázání těchto údajů je možné rozdělit GIS na tři základní generace (podle toho, jak se vyvíjely GIS i DBMS).
1. generace
- Systém bez atributových souborů:
- Hodně se používá u čistě rastrových systémů - není oddělen prostorový a popisný údaj.
- Systémy s tzv. flat soubory (jedná se v podstatě o tabulky bez možnosti relací), využívají souborově orientovaný systém.
Stručný popis:
- Ke každému objektu je možné přiřadit pouze 1 tabulku (spojení prostorových a atributových dat je provedeno přes id_objektu, které funguje jako klíč).
- Tento způsob je velice nepraktický, pokud potřebujeme nějaký údaj využívat na více místech. Tento problém pramení z omezení souborového přístupu k datům, jak na které jsme narazili v předchozích kapitolách.
Příkladem takového systému je třeba GIS IDRISI. Obecně se tyto GIS využívají dodnes převážně při rastrových analýzách (viz. dále).
2. generace:
- Duální/hybridní způsob propojení prostorových a atributových dat:
- Je to velice rozšířený způsob, kde grafika je zpracovávána jednom systému, atributy v DBMS někde jinde (příklad dřívější verze ARC/INFO, kde už z názvu je vidět, že jeden systém (ARC) zpracovává grafiku a druhý (INFO) se stará popisné atributy). Dalším příkladem může být formát shapefile, který má prostorová data uložena v souboru s příponou *.shp, atributová data v souboru s příponou *.dbf a spojení mezi atributovými a prostorovými daty zajišťuje indexový soubor s příponou *.shx.
- Občas se ještě používá rozdělení na DBMS implementovaný do GIS a externí DMBS- zde je nutné podotknout, že i 1. případ umožňuje využívat externí DBMS.
- Díky dualitě má však tento model problémy s integritou (konzistencí) dat a to především mezi prostorovou a popisnou složkou (nelze zaručit, že někdo pomocí DBMS neobejde GIS SW nemodifikuje data přímo v DB).
- Neřeší problematiku dlouhých transakcí - viz. minulá kapitola.
- Může mít problémy s ukládáním většího objemu dat, z čehož mohou plynout problémy s bezešvými daty. Data je obvykle nutno dělit podle zájmových oblastí, či mapových listů.
Příkladem může být již zmiňované ARC/INFO; MGE; ArcGIS, pracující s formátem SHP a další systémy.
- Integrovaný model
- Tento model se rozšiřuje hlavně v poslední době.
- Vše je uloženo v jedné databázi (jak prostorová, tak popisná složka), ale využíván je pouze standardní relační model.
- O management všech geografických dat se stará tzv. middleware, což je produkt tvořící komunikační vrstvu mezi databází a GIS, nikoli tedy databáze samotná.
- Díky uložení prostorové části v databází je možné používat bezešvá prostorová data a odpadá dělení prostorou na mapové listy.
- Model je však relativně pomalý (hlavně kvůli tomu, že standardní relační databáze neumí efektivně ukládat prostorová data).
- Není definován standard přístupu k prostorovým datům v databázi (prostorová data jsou uložena jako binární posloupnosti (Binary Large Objects - BLOBs), což znemožňuje data zpracovávat již v DBMS či pomocí jiného SW).
- Model neodstraňuje problémy s dlouhými transakcemi a integritou dat.
Příkladem může být ARC/INFO s modulem ArcStorm, SDE, Geomedia.
Speciálním případem integrovaného modelu jsou pak prostorové databáze, které umožňují ukládat prostorová data ve standardizované podobě spolu s atributy. Díky tomu, že middleware se v podstatě přesunul do DBMS (je součástí DBMS), jsou odstraněny problémy s integritou dat a částečně i s výkonností. Příkladem je Oracle Spatial.
3. generace
- Objektový model
- V objektové databázi jsou uloženy přímo objekty reprezentující reálný objekt, tzn. že prostorové i atributové složky jsou uloženy spolu s metodami objektu.
- V tomto modelu se celý GIS pak stává vlastně Objektově Orientovanou Databází - OODB.
- V databázi jsou obvykle definovány základní třídy geografických objektů (bod, linie, polygon, rastr), a od nich jsou pak pomocí dědičnosti odvozeny další, složitější a specializovanější třídy. Například z primitivní třídy linie je odděděna třída komunikace (má již specifické chování a atributy nutné pro komunikaci, jako je povrch, počet pruhů, …) a z třídy komunikace pak třída dálnice (jedná se o speciální případ komunikace se speciálními atributy a metodami).
- Díky objektově orientovanému řešení je obvykle řešena i problematika různé grafické reprezentace téhož objektu (například elektrické vedení bude jinak vizualizováno ve schématické sítí, než v mapě), která je od GIS v poslední době často požadována.
- Model nemá žádné problémy s integritou (je řešena již na úrovni objektu).
- Díky principu práce OODB není většinou problém s dlouhými transakcemi, vše je řešeno na úrovni uchovávání několika verzí objektu.
- Existují však problémy s výkonností systému a částečně i s napojením na standardní relační databázi.
Příklad systému je Smallworld (velice využívaný správci inženýrských sítí).
- Objektově-relační přístup s podporou prostorových dat
- Je to kompromis relačního modelu a objektového modelu - bere to nejlepší z obou dvou modelů.
- Je možné vytvářet objekty, ale podporuje i klasická data.
- Využívá speciálních indexačních mechanismů, které podporují prostorová data.
- Umožňuje snadno integrovat stávající relační DB do nového prostředí.
- Díky tomu, že se o prostorová data stará přímo DBMS, je integrita dat bezproblémová.
Příkladem je Oracle Spatial Cartridge, ArcGIS a Geodatabase.