Dublin Core og landfræðileg gögn (96)

Með auknu upplýsingaflóði sem fylgdi stafrænum gögnum og nýjum gerðum og formi gagna kom fram þörf fyrir að finna leið til að skrá upplýsingar um ólík gögn, eldri sem ný rafræn gögn, með samstilltum kjarna skráningaratriða. Þekktustu og útbreiddustu skráningarreglurnar á þessu sviði eru líklega svonefnt „Dublin Core“ (DC) lýsigagnasnið. Reglurnar voru upphaflega hugsaðar sem samræmt skráningarform fyrir breitt svið gagna og annars efnis á ólíku formi í fjölbreytilegustu söfnum. Gagnasniðið getur nýst fyrir skráningu margbreytilegs efnis allt frá skjölum, bókum, ljósmyndum, kvikmyndum, listmunum, náttúrugripum, kennsluefni, vefskrám, rafbókum og landfræðilegum gögnum svo eitthvað sé nefnt. Kjarnaatriðin voru upphaflega 15 en síðan er hægt að bæta við fjölmörgum fleiri efnisþáttum eftir því hvað þarf í hverju tilfelli. Dublin Core hefur verið þróað mjög á þeim rúmu tveimur áratugum síðan fyrstu útgáfur þess voru settar fram. Grunnvinnuna hér á landi við að þýða og kynna DC vann Sigurbergur Friðriksson bókasafns- og upplýsingafræðingur, en árið 2001 ritaði hann handbók fyrir íslensk söfn um Dublin Core lýsigagnasniðið sem er grundvallarskýrsla á þessu sviði á íslensku. Notkun þessa lýsigagnasniðs hér á landi hefur ekki verið mikil a.m.k. ekki eftir umræðunni að dæma.

Dublin Core er talið til svonefndra almennra lýsigagnastaðla. Það er afar mikilvægt að gera skýran greinarmun annars vegar á hinum almennu stöðlum og hins vegar á sértækum landrænum lýsigögnum eins og í eldri lýsigagnastöðlum, svo sem FGDC, ANZLIC og CEN TC287 og nýrrri alþjóðlegum ISO stöðlum, til dæmis 19115, 19119 og 19139, auk INSPIRE Metadata Core sem byggir á ISO stöðlunum.

Hér á landi er aðeins til einn lýsigagnagrunnur svo vitað sé sem byggir á kjarna (Core) í þremur megin lýsigagnastöðlunum sem tengja má gögnum og efni á sviði landfræðilegra upplýsinga: ISO, INSPIRE og DC. Grunnurinn geymir lýsigögn fyrir stafræn landupplýsingagögn á Orkustofnun og eru í honum skráðir yfir 40 efnisþættir. Við uppbyggingu grunnsins kom í ljós hið mikla misræmi sem er oft í heitum og skilgreiningu sömu atriða milli staðla, eins og skilgreiningar titils, útgefnda og ábyrgðaraðila gagna svo dæmi séu tekin.

Í bókinnni „Geographical Information Metadata for Spatial Data Infrastructures“, sem út kom árið 2005, er farið ítarlega í ósamræmið við skilgreiningu áðurnefndra skráningarþátta í mismunandi stöðlum og gerðar tillögur um það hvernig mætti fara í alþjóðlega samræmingarvinnu í þessu sambandi.

Dublin Core hefur tvo landfræðilega efnisþætti DCMI Point og DCMI Box. Í þeim fyrrnefnda má skrá staðsetningu með hnitpunkti og í þeim síðari má afmarka „ramma“, svonefnt „Bounding Box“, utan um svæði með því að skilgreina fjóra bauga sem snerta ystu mörk svæðis (N, S, A, V). Gallinn við slíka afmörkun er auðvitað sá að við leit koma fram leitarniðurstöður sem nýtast ekki, þar sem ramminn nær oft út fyrir það svæði sem verið er að sýna. Slíkt er þó af tvennu talið betra, en þá verður sá sem leitar að sía upplýsingarnar með þetta í huga. Framsetning ramma utan um svæði með „Bounding Box“ aðferð getur verið hentug í almennri skráningu en hentar hins vegar ekki eins vel til dæmis fyrir kort í kortaröðum. Þar þarf að fara aðrar leiðir. Í DC hefur ekki verið gert ráð fyrir skráningu mælikvarða, sem er í raun mjög undarlegt. Það er hins vegar ekki vandamál að bæta slíku við með sértækum hætti og horfa þá til skilgreininga frá öðrum stöðlum.

Ég tel að Dublin Core hugmyndafræðin sé mjög vannýtt lausn hér á landi, en ekki hefur farið hátt hvernig hún er nýtt á Íslandi og í raun hefur ekki svo vitað sé verið gerð skoðun á því.  Það er gagnlegt að hafa aðgang að stöðluðum alþjóðlegum skráningarreglum sem má nýta við utanumhald safnefnis sem er ólíkt að formi og gerð. Þetta á bæði við innan fagsviðsins „landfræðileg gögn“ sem og innan annara málaflokka safnefnis. Það er hins vegar verk að vinna í því að samræma heiti og skilgreiningar skráningarþátta milli DC og sértækari staðla eins og ISO, en á það hefur meðal annars verið bent í lærðum ritum erlendis. Til að undirstrika notagildi DC má benda á að framsækin landfræðileg kortaverkefni erlendra safna á liðnum árum eins og Old Maps Online og Cartomundi nota staðlaða framsetningu DC skráa til að birta í vefmiðlun þeirra kortasjáa. Sama mætti gera hér á landi í ýmsum vefverkefnum sem fjallað hefur verið um að koma þurfi á dagskrá.

Þorvaldur Bragason