Landrænn lýsigagnagrunnur hjá stofnunum (46)

Til þess að halda utan um landræna gagnaflokka og gagnasett er nauðsynlegt að upplýsingar um gögnin séu vel skráðar. Við skráninguna verða til gögn um gögn eða svonefnd lýsigögn, en við sérhverja uppfærslu gagnasetts þarf nýja lýsigagnafærslu. Orkustofnun setti á árinu 2012 upp sérstakan lýsigagnagrunn, þann eina sinnar tegundar hér á landi, til þess að tryggja stöðlun, samræmi og yfirsýn yfir öll lýsigögn fyrir landrænar upplýsingar á stofnuninni. Talið er að margar stofnanir gætu haft verulegt gagn af því að eiga slíka grunna.

Hvatinn að baki verkefninu var í margþættur, en lög nr. 44/2011 um grunngerð fyrir stafrænar landupplýsingar, skylda opinberar stofnanir meðal annars til að skrá lýsigögn fyrir öll landræn gagnasett sem falla undir INSPIRE tilskipun Evrópusambandsins og miðla þeim til birtingar í samræmdu opinberu vefverkefni á Netinu. Hér á landi hefur verið ákveðið að Landupplýsingagátt gegni því hlutverki. Annar mikilvægur þáttur er að fá þurfti samræmda yfirsýn yfir öll eldri landupplýsingagögn Orkustofnunar á stafrænu formi, en í flokki Jarðkönnunarkorta eru til dæmis til á annað hundrað eldri gagnasett á vektor formi. Langtímavarðveisla gagnanna byggir meðal annars á því að til séu staðlaðar upplýsingar um þau og staðsetningu þeirra á tölvukerfi stofnunarinnar, en innan einhverra ára gæti þurft að afrita slík gögn og koma þeim á samræmt varðveisluform vegna hugsanlegra skila til Þjóðskjalasafns. Eina skynsamlega leiðin til að halda utan um umræddar gagnaupplýsingar er með skráningu lýsigagna í gagnagrunn, samkvæmt alþjóðlegum stöðlum. Einn þátturinn enn tengist landfræðilegum gögnum af landgrunninu, einkum Drekasvæði sem hafa verið skráð á liðnum misserum. Birting upplýsinga um þau í íslenskri og enskri útgáfu Landgrunnsvefsjár hefur kallað á samræmda skráningu og vistun lýsigagna fyrir þessi gagnasett. Þá væri jafnvel einnig mögulegt að skrá í grunninn lýsigögn fyrir stafræn gögn sem eru ekki með staðsetningarupplýsingum, en eru tengd landrænum verkefnum. Í þessum flokki gætu verið gagnatölfræði og gagnatöflur af ýmsu tagi settar fram fyrir landið allt.

Fyrrnefnd gagnaverkefni ásamt þörfinni fyrir að eiga lýsigagnafærslur fyrir hverja „útgáfu“ hinna opinberu gagnasetta sem falla undir INSPIRE, leiddi til skoðunar á mögulegum lausnum. Engar erlendar fyrirmyndir eru til svo vitað sé fyrir verkefni sem þetta, en í bókinni „Geographic Information Metadata for Spatial Data Infrastructures“ sem út kom árið 2005, er fjallað nokkuð um mikilvægi þess að við staðlagerð og uppfærslu staðla verði að huga betur að samstillingu skilgreininga á milli ISO 19115 og Dublin Core og nefnd dæmi um hvernig nálgast þyrfti slíka vinnu. Eftir útgáfu bókarinnar kom fram hin nýja skilgreining á INSPIRE lýsigögnum sem féll ekki nema að hluta að þessari sýn, enda algerlega óháð rit.

Til þess að halda öllum leiðum opnum var ákveðið að nálgast skilgreiningu lýsigagnagrunns OS þannig að öll kjarnaatriði kæmu fram. Skráningarþættirnir í grunninum taka því mið af þremur lýsigagnastöðlum, þ.e. „kjörnum“ (e. metadata cores) efnisatriða úr alþjóðlegum lýsigagnastöðlum. Alls eru í lýsigagnagrunninum yfir 40 skráningarþættir, nokkrir þeirra eru sameiginlegir í öllum kjörnunum þó þeir hafi ekki nákvæmlega sama heiti og skilgreiningu í texta, en aðrir eru sérstakir og koma aðeins fyrir í einum kjarna. Um er að ræða eftirtalda staðla: a) International standard: Geographic information – Metadata. ISO 19115 (22 atriði í kjarna), b) INSPIRE Metadata Implementing Rules: Technical Guidelines based on EN ISO 19115 and EN ISO 19119 (24 atriði í kjarna), c) Dublin Core Metadata Initiative (15 atriði í kjarna). Í ljós kom við greiningu kjarnanna að í þeim öllum eru 9 atriði sambærileg, önnur eru annaðhvort í tveimur eða einum af kjörnunum. Flestir skráningarþættirnir eru með einhverjum hætti til innan ISO 19115, aðeins fjórir eiga sér þar ekki samsvörun, þar af eru tveir í ISO 19119 og tveir aðeins í Dublin Core. Hins vegar kom á óvart hvað lagðar eru mismunandi áherslur í kjörnunum ISO 19115 Core og INSPIRE Core.

Í innsláttarvalmynd grunnsins er vísað til númera í stöðlunum, þannig að auðvelt á að vera að sjá hvaða efnisþætti úr hverjum kjarna er verið að skrá í hverjum dálki. Ef beðið væri um útprentun á færslum úr lýsigagnagrunninum á sniði einhverra hinna þriggja kjarna eða þeirra allra, ætti að vera mögulegt að keyra slíkt út eftir óskum hvers og eins. Heiti dálkanna (á ensku) fyrir sams konar fyrirbæri í kjörnunum eru oftast mismunandi og því var reynt að velja íslensk heiti sem væru lýsandi fyrir efnið.

Þegar ný útgáfa gagnasetts er gerð verður til ný færsla í lýsigagnagrunninum og mögulegt er síðan að rekja slóðina til baka í færslur fyrir eldri útgáfur viðkomandi gagnasetts. Lýsigagnagrunnur OS var upphaflega settur upp í oracle gagnagrunni, en var síðan færður í annað gagnagrunnsumhverfi. Með því ætti að vera auðveldara að þróa verkefnið áfram og gera það sveigjanlegra og aðgengilegra fyrir notendur, auk þess sem þróa má í þessu samhengi hugbúnaðarlausn sem gæti leyst ýmis vandamál á þessu sviði hjá fleiri stofnunum.

Þorvaldur Bragason