torek, 23. oktober 2012

Povezani podatki


© W3C
Mednarodni inštitut World Wide Web Consortium (W3C), ki ga je leta 1994 ustanovil Sir Tim Berners-Lee, znan predvsem kot izumitelj svetovnega spleta, in ki se uveljavlja s promocijo spletnih tehnologij in razvojem spletnih standardov, se že od leta 1999 intenzivno ukvarja s semantičnim spletom, ki bo (do neke mere je že) revolucionarno posegel v možnosti spletnega iskanja in priklica informacij. Ob semantičnem spletu, ki sloni na močno strukturiranih metapodatkih, ti pa omogočajo računalnikom razumeti zapletene odnose med objekti, se pojavljajo ključne besede Linked Data, Machine-Readable Web, Web of Data in Web 3.0. Nekaj let že poslušamo, da je semantični splet "takorekoč tukaj", vendar ga je Tim Berners-Lee oznanil kot dejansko dostopnega in uporabnega šele leta 2008. Ob tem pa ne gre zatiskati oči pred dejstvom, da se knjižnice v tem času še močno spopadajo s tehnologijami spleta 2.0 in bo do semantičnega spleta, znanega tudi kot splet povezanih podatkov, še dolga in bržkone trnava pot.

V računalništvu se uporablja termin povezani podatki takrat, kadar so podatki objavljeni in dostopni na tak način, da omogočajo sicer standardne spletne tehnologije logično in pomensko povezovanje podatkov iz različnih virov in v različnih oblikah s pomočjo strukturiranih metapodatkov, ki jih računalniki "razumejo" in za človeka izboljšajo kakovost iskanja in tako pridobljenih informacij. Termin je sicer skoval Tim Berners-Lee, vendar je sam pojav že dolgo znan na različnih področjih, v bibliotekarstvu na primer pri citiranju in citatnih indeksih ali v normativni kontroli.

Google Books Ngram Viewer kaže uporabo termina linked data v literaturi. Težko je seveda presoditi, kolikšen delež ima pri tem prosta zveze s pomenom "(kateri koli) podatki, ki so povezani" in koliko termin, ki je bil predstavljen zgoraj.

Kako pa je s slovenskimi poimenovanji? Kot prepogosto se v slovenskih besedilih, tudi strokovnih in znanstvenih, pojavlja termin kar v izvirni angleški obliki (npr. Uporaba pristopa linked data za integracijo porazdeljenih podatkov s spleta. Diplomska naloga, 2012; "Pristop Linked data po slovensko imenujemo pristop povezanih podatkov, vendar še ne obstaja splošno priznano slovensko ime, ker je celotno raziskovalno področje staro le nekaj let", ibid.), kar je seveda posledica precejšne novosti termina in ob tem negotovosti pisca, kaj in kako uporabiti v slovenščini. Na različne jezikovne vire se je težko opreti, saj pogosto naletimo na ti. prosto besedno zvezo (npr. Nova beseda: S terorizmom povezani podatki se namreč zbirajo v več kot dvajsetih . . . ), ki nima z našim terminom prav nobene zveze, zastopanost pravega termina pa je v korpusih Nova beseda, GigaFida, Konkordančniku za Islovar zelo majhna. V Korpusu bibliotekarstva se pojavi v dveh dokumentih iste avtorice, v reviji Knjižnica ga ni mogoče zaslediti, pač pa je nekaj malega v Knjižničarskih novicah, Organizaciji znanja in nekaterih časapisnih člankih (npr. Ustanovitelj interneta svari pred možnim vohunjenjem za aktivnostjo uporabnikov. Dnevnik, 15.3.2009) in tudi Opacu, ki kaže predvsem na zaključna dela ljubljanske in mariborske univerze. V okviru svojega letošnjega kongresa je IFLA pripravila 13. avgusta posebno okroglo mizo o povezanih podatkih, zato najdemo slovenski termin tudi v poročilu dr. A. Kavčič-Čolić pa tudi na nedavnem posvetu visokošolskih in specialnih knjižnic je bilo o tem govora.

Termin povezani podatki se je po tem sodeč že (sicer sramežljivo) "prijel" in ga uporabljamo v različnih strokovnih okoljih, ob njem pa še nekaj drugih:

linked data povezani podatki
open data odprti podatki
linked open data povezani odprti podatki, LOD
linked open library data povezani odprti podatki knjižnic
semantic web semantični splet
web of data podatkovni splet
web of linked data splet povezanih podatkov
Web 3.0 Splet 3.0


Kaj so povezani podatki?


Povezani podatki in knjižnice.

Ni komentarjev:

Objavite komentar

Opomba: Komentarje lahko objavljajo le člani tega spletnega dnevnika.