sobota, 27. oktober 2012

Globinsko povezovanje

Časi so že taki, da se mi je na deževen in s predvolilnim golažem zapackan sobotni večer po sprehodu s psom zahotelo nekaj lahkotnega pa vendar dovolj pikantnega branja in kaj bi lahko bilo razmeram primernejšega kot malo kramljanja z Butalci. Tiskane knjige v ustvarjalnem kaosu delovne sobe nisem našel, tista elektronska pa je iz prve generacije slovenske elektronske založniške produkcije in na bralniku bolj slabo čitljiva, zato sem se odločil pobrskati po spletu in najti kakšno novejšo elektronsko izdajo. Ni jih malo, od brezplačnih ilustriranih ali tudi ne, do takih za dva evra, tiskane so v knjigarnah seveda desetkrat in več dražje. Z "guglanjem" ni bilo težav, šlo je hitro in neproblematično, našel sem, kar sem potreboval, in brez zapletov pretočil na svoj računalnik. Pa mi hudič ni dal miru in sem šel pobrskat še v katalog(e) naših knjižnic . . . in tam se je rodila ideja za današnji sestavek. Rekel bi, da iz stiske nemočnega uporabnika.

O tem, da je v opacu nemogoče izbrskati samo elektronske knjige in jih že v postopku iskanja ločiti od tiskanih, ne bi razpredal. To bi bilo danes nujno. Pravzaprav že včeraj. Ko sem silom prilik vendarle ročno izbrskal elektronske Butalce, se je zapletlo – v zapisu (slika levo) so lepo kot se spodobi nanizani različni ISBN-i za tri formate računalniških datotek, pa še nakaj podobnega, kar se lahko samo z nekaj znanja razšifrira kot UDK. In pod tem zagonetni stavek: Dostopna je elektronska verzija dokumenta ali pa gre za elektronski vir. Tudi po daljšem razmišljanju in ugibanju ne razumem, kaj mi je hotela knjižnica s tem povedati. Kaj je elektronska verzija in kaj elektronski vir?

No, prave težave so se začele šele sedaj – klik na hiperpovezavo v bibliografskem zapisu me je pripeljal na spletno stran založbe, kjer bi me morali čakati Butalci ali pa vsaj sporočilo, da je knjiga tam, vendar iz takih in takih razlogov nimam pravice do njene uporabe. Pa ne, prav na uvodno pozdravno stran sem prijadral! Tipičen primer neustrezne uporabe "navadne" (hiper)povezave tam, kjer bi morala biti ti. globinska povezava (varianta: globoka povezava). Domnevam, da je dal napačne podatke ob oddaji obveznega izvoda založnik. Temu v dobro štejem tudi to, da v desetih minutah brskanja po njegovem spletišču knjige vseeno nisem našel. So šli Butalci v ilegalo?

Kaj je globinsko povezovanje? To je uporaba hiperpovezave (ki se zato imenuje globoka povezava, globinska povezava), ki ne vodi na osnovno stran ali začetek dokumenta, temveč neposredno do lokacije v notranjosti – npr. do določene prosojnice v predstavitvi, odstavka ali slike v besedilu, izbranega dokumenta ali strani spletišča ipd. Ko se je splet začel razvijati, so zunanje povezave navadno vedno kazale na prvo stran spletišča oz. na začetek posameznih dokumentov. Kmalu pa se je pokazalo, da to ne zadošča, saj je navadno težko najti tisto mesto, ki nas res zanima, če vedno začenjamo z začetne strani. Tržne raziskave so npr. pokazale, da je prav ta težava, ki je posledica nepotrebnega dodatnega iskanja in tavanja, kriva za več kot četrtino neuspelih poizkusov spletnega nakupovanja. Tudi knjižnica, ki v novicah opozarja na nov cenik ali program izobraževanja, bo z globinskim povezovanjem popeljala uporabnike neposredno na ta dokument, ne pa na začetek domače strani knjižnice. Ilustrativni pimer navadnega in globinskega povezovanja v katalogu za isto knjigo je spodaj:


"Navadna" povezava popelje uporabnika samo na stran založbe – potem pa znajdi se!


Ustrezna globinska povezava pripelje uporabnika prav do elektronske knjige.

Tudi tokrat imamo težave s poimenovanjem v slovenščini. Najpogosteje je mogoče zaslediti kar angleški termin v slovenskem stavku, govorjenem pa tudi pisanem. Zelo redko (pa vendar) se pojavljajo tudi slovenski poizkusi ustreznic globinska povezava, globoka povezava in globinsko povezovanje, globoko povezovanje. Zanimivo je zapažanje, da se na spletu pojavljajo najpogosteje v določilih, vezanih na intelektualno lastnino in pogoje uporabe spletnih dokumentov, npr.:

  • Vzpostavitev povezav na posamezne podstrani spletišča *** d.o.o. brez jasne označbe porekla je izrecno prepovedana (globinsko povezovanje).
  • Globinsko povezovanje (deep linking) na fotografije objavljene v fotogaleriji ni dovoljeno.
  • Globinsko povezovanje (deep linking ) na fotografije objavljene v *** ni dovoljeno.
  • Izboljšana pa je tudi podpora za razvijalce programov, ki imajo sedaj poenostavljen proces registracije in možnost kreiranja »deep link« povezave do svojih aplikacij.
Tuji viri navajajo, da je bilo že precej odmevnih tožb na račun neustreznega povezovanja na strani komercialnih spletišč, ki tega ne dovoljujejo.

Zaradi podobnosti navajam še termine notranja povezava, notranje povezovanje, zunanja povezava, zunanje povezovanje, ki opredeljujejo "domet" povezave. Povezava z enega dokementa na drugega, z enega vira na drugega je zunanja, npr. povezava z bloga na Wikipedijo, s članka na slovar ipd. Povezava, ki vodi na drug del istega dokumenta ali vira, je notranja, npr. povezava med deli istega članka, objavami istega vira. Uporablja kdo med bralci kaj drugega, boljšega in ustreznejšega?

deep link- globoka povezava, globinska povezava
deep linking- globoko povezovanje, globinsko povezovanje
internal linking- notranje povezovanje
internal link- notranja povezava
external link- zunanja povezava
external linking- zunanje povezovanje

torek, 23. oktober 2012

Povezani podatki


© W3C
Mednarodni inštitut World Wide Web Consortium (W3C), ki ga je leta 1994 ustanovil Sir Tim Berners-Lee, znan predvsem kot izumitelj svetovnega spleta, in ki se uveljavlja s promocijo spletnih tehnologij in razvojem spletnih standardov, se že od leta 1999 intenzivno ukvarja s semantičnim spletom, ki bo (do neke mere je že) revolucionarno posegel v možnosti spletnega iskanja in priklica informacij. Ob semantičnem spletu, ki sloni na močno strukturiranih metapodatkih, ti pa omogočajo računalnikom razumeti zapletene odnose med objekti, se pojavljajo ključne besede Linked Data, Machine-Readable Web, Web of Data in Web 3.0. Nekaj let že poslušamo, da je semantični splet "takorekoč tukaj", vendar ga je Tim Berners-Lee oznanil kot dejansko dostopnega in uporabnega šele leta 2008. Ob tem pa ne gre zatiskati oči pred dejstvom, da se knjižnice v tem času še močno spopadajo s tehnologijami spleta 2.0 in bo do semantičnega spleta, znanega tudi kot splet povezanih podatkov, še dolga in bržkone trnava pot.

V računalništvu se uporablja termin povezani podatki takrat, kadar so podatki objavljeni in dostopni na tak način, da omogočajo sicer standardne spletne tehnologije logično in pomensko povezovanje podatkov iz različnih virov in v različnih oblikah s pomočjo strukturiranih metapodatkov, ki jih računalniki "razumejo" in za človeka izboljšajo kakovost iskanja in tako pridobljenih informacij. Termin je sicer skoval Tim Berners-Lee, vendar je sam pojav že dolgo znan na različnih področjih, v bibliotekarstvu na primer pri citiranju in citatnih indeksih ali v normativni kontroli.

Google Books Ngram Viewer kaže uporabo termina linked data v literaturi. Težko je seveda presoditi, kolikšen delež ima pri tem prosta zveze s pomenom "(kateri koli) podatki, ki so povezani" in koliko termin, ki je bil predstavljen zgoraj.

Kako pa je s slovenskimi poimenovanji? Kot prepogosto se v slovenskih besedilih, tudi strokovnih in znanstvenih, pojavlja termin kar v izvirni angleški obliki (npr. Uporaba pristopa linked data za integracijo porazdeljenih podatkov s spleta. Diplomska naloga, 2012; "Pristop Linked data po slovensko imenujemo pristop povezanih podatkov, vendar še ne obstaja splošno priznano slovensko ime, ker je celotno raziskovalno področje staro le nekaj let", ibid.), kar je seveda posledica precejšne novosti termina in ob tem negotovosti pisca, kaj in kako uporabiti v slovenščini. Na različne jezikovne vire se je težko opreti, saj pogosto naletimo na ti. prosto besedno zvezo (npr. Nova beseda: S terorizmom povezani podatki se namreč zbirajo v več kot dvajsetih . . . ), ki nima z našim terminom prav nobene zveze, zastopanost pravega termina pa je v korpusih Nova beseda, GigaFida, Konkordančniku za Islovar zelo majhna. V Korpusu bibliotekarstva se pojavi v dveh dokumentih iste avtorice, v reviji Knjižnica ga ni mogoče zaslediti, pač pa je nekaj malega v Knjižničarskih novicah, Organizaciji znanja in nekaterih časapisnih člankih (npr. Ustanovitelj interneta svari pred možnim vohunjenjem za aktivnostjo uporabnikov. Dnevnik, 15.3.2009) in tudi Opacu, ki kaže predvsem na zaključna dela ljubljanske in mariborske univerze. V okviru svojega letošnjega kongresa je IFLA pripravila 13. avgusta posebno okroglo mizo o povezanih podatkih, zato najdemo slovenski termin tudi v poročilu dr. A. Kavčič-Čolić pa tudi na nedavnem posvetu visokošolskih in specialnih knjižnic je bilo o tem govora.

Termin povezani podatki se je po tem sodeč že (sicer sramežljivo) "prijel" in ga uporabljamo v različnih strokovnih okoljih, ob njem pa še nekaj drugih:

linked data povezani podatki
open data odprti podatki
linked open data povezani odprti podatki, LOD
linked open library data povezani odprti podatki knjižnic
semantic web semantični splet
web of data podatkovni splet
web of linked data splet povezanih podatkov
Web 3.0 Splet 3.0


Kaj so povezani podatki?


Povezani podatki in knjižnice.

sobota, 13. oktober 2012

Po meri uporabnika?


© Publishers Communication Group
Izbor in nabava najprimernejših ter najpotrebnejših vsebin glede na ciljne skupine uporabnikov je izziv, s katerim se knjižnice srečujejo vse od svojega nastanka. Opiranje na znane potrebe uporabnikov je doslej temeljilo na knjigah želja, zasledovanju zahtevkov za medknjižnično izposojo, beleženju neizpolnjenih zahtev na izposoji in podobnem. Pojav elektronskih knjig in splošna razširjenost uporabe elektronskih bralnikov, prenosnih računalnikov in predvsem tabličnih računalnikov ter celo telefonov za branje elektronskih knjig ponujajo knjižnicam nove možnosti za učinkovitejše in predvsem bolj ekonomično zadovoljevanje potreb uporabnikov.

PDA (Patron-Driven Acquisition) je hitro naraščajoča metoda oz. poslovni model organizacije nabave knjižničnega gradiva, predvsem elektronskih knjig. Po tem modelu knjižnica kupi (v nekaterih primerih "najame" oz. zagotovi dostop) samo knjige, do katerih so uporabniki pred tem že želeli dostopati oz. so jih celo že uporabili. V praksi to pomeni, da bo knjižnica kupila manj "nepotrebnih knjig" (po metodi "just in case"), dejanski nakup pa se časovno zamakne, saj je bila knjiga "v obtoku" in uporabi že pred nakupom. Knjižnica torej več ne gradi velike stalne zaloge knjig, ki jih kupuje na osnovi predvidevanja, kaj bi uporabniki utegnili potrebovati in zahtevati, pač pa na osnovi dejanskega že izkazanega interesa uporabnikov. Predvidevanja knjižnice so lahko napačna, po drugi strani pa postaja tradicionalna izgradnja knjižnične zbirke vse manj smiselna tudi po ekonomski plati zaradi zmanjševanja proračuna in rasti cen, ko prihaja do vse večjega razkoraka med potrebami in (z)možnostmi. Doslej veljaven model izgradnje knjižnične zbirke več ne zdrži kritične presoje.

PDA sloni na enostavnem mehanizmu: v danes že prevladujočem digitalnem okolju pripravi knjižnica v sodelovanju s ponudniki vsebin svojim uporabnikom širok nabor naslovov, ki pa jih še ne kupi. Uporabniki po njih brskajo in iščejo ali že preberejo, kar jih zanima oz. kar potrebujejo, ko pa uporaba preseže določen prag (določeno število pregledanih strani e-knjige, prenos e-knjige ali članka na uporabnikov računalnik ipd.), bo knjižnica za to dobila račun in knjigo ali članek kupila, ne da bi uporabnik vedel, da je s svojimi dejanji vplival na knjižnično nabavo. Tak model nabave in uporabe virov omogoča po eni strani veliko večjo svobodo, izbiro in dostopnost gradiv, knjižnicam pa pomaga rešiti enega največjih problemov v preteklosti – (ne)uspešno odločanje o nabavi in riziko nakupa nepotrebnega gradiva ob pomanjkanju tistega, kar uporabniki dejansko potrebujejo in česar model nabave "just in case" ne zagotavlja. DeGruyter je lansko leto v raziskavi o PDA ugotovil, da okrog 40% knjig, ki jih kupijo visokošolske knjižnice, ni nikoli izposojenih, naslednjih 40% pa je izposojenih manj kot trikrat (kar potrjuje predpostavke informacijskih zakonov 80:20).


Po podatkih PCG je uporaba na zalogo kupljene literature še slabša.

Dober ilustrativen primer PDA ponuja na primer EBSCOhost za elektronske knjige v treh poenostavljenih korakih:

  1. Knjižnica pripravi zbirko - v skladu s potrebami uporabnikov je treba izbrati potencialno zanimive in koristne naslove (npr. glede na specializirano založbo, strokovno področje ipd.)
  2. Uporabniki imajo možnost dostopa do zbirke in uporabe gradiva - knjižnica prenese bibliografske podatke v svoj katalog, da jih lahko uporabniki z brskanjem ali iskanjem najdejo in neovirano ter brez omejitev uporabljajo
  3. Knjižnica kupi samo uporabljene naslove - nakup elektronske knjige sledi, če uporabnik
    • Prenese e-knjigo na svoj računalnik
    • Lista po e-knjigi več kot deset minut
    • Preglede več kot deset strani e-knjige
    • Del e-knjige natisne, pošlje po e-pošti ali prevzame z ukazi "kopiraj&prilepi"
    Na tak način uporabnik z izposojo/uporabo e-knjige neposredno "sproži" njeno nabavo.
V angleščini srečujemo poleg zelo razširjene kratice PDA (in PGA – Patron Generated Acquisition) za tovrstno dejavnost najpogosteje še (pisano z vezajem ali s presledkom):
        patron driven acquisition
        demand driven acquisition
        user-driven acquisition
        economy driven acquisition
        user-driven purchasing
        reader- or patron-driven acquisition
in verjetno še kaj.

Kako pa v slovenščini? Na terminološki problem me je že pred dopusti opozoril mariborski kolega Igor in iz najinega modrovanja je nastala današnja objava. Kot (pre)pogosto smo tudi tukaj v zadregi in mencamo z angleško kratico ali si lomimo jezik z angleškim terminom v slovenskem stavku, kar seveda ne gre. V Korpusu bibliotekarstva (najnovejša verzija, ki vsebuje 3,6 milijona besed iz 625 strokovnih bibliotekarskih besedil), se pojavlja PDA samo dvakrat, obakrat v istem članku, objavljenem leta 2011 v reviji Knjižnica. Samo v tem članku je mogoče zaslediti tudi poizkus slovenjenja, čeprav le bolj opisno kot nakup glede na potrebe uporabnikov.

Viharjenje s kolegi je rodilo nekaj bolj ali manj neuspešnih predlogov kot npr. uporabniška nabava, uporabniško vzpodbujena nabava, uporabniško usmerjana nabava, nabava na pobudo uporabnikov, uporabniško vodena nabava, nabava, ki jo določajo uporabniki, nabava po meri uporabnika, pristop, ki izhaja iz uporabnika, k uporabnikom orientirana nabava, na uporabnike osredotočena nabava, od uporabnika spodbujena nabava, uporabniško zasnovana nabava in še kaj. Skratka nič uporabnega.

Pridevniško besedo driven (ali generated) navadno slovenimo kot (za)gnan, voden, orientiran, usmerjen, naravnan, vzpodbujen . . ., v nekaterih drugih podobnih primerih smo se doslej dokaj elegantno rešili tudi s samostalniškim pridevnikom (npr. command-driven – ukazen, menu-driven – menijski), v tem primeru pa to ne bi šlo (uporabniška nabava ne ustreza pomenu ali celo zavaja, da uporabniki sami nabavljajo knjige). Žal vsebinsko in pomensko ni ustrezna niti varianta z "usmerjen, orientiran, voden" - uporabniško usmerjena nabava (k uporabnikom orientirana nabava) je pravzaprav že ves čas tudi tradicionalna nabava z upoštevanjem potreb/želja uporabnikov, uporabniško vodena pa z upoštevanjem uporabnikovih predlogov oz. zahtev. "Uporabniško usmerjana nabava" (poudarjam razliko v pisavi! Pisano z "a") je od teh mogoče pomensko še najbolj blizu, vendar termin najbrž (vsaj sedaj) še ni jasen, enako "uporabniško vzpodbujena nabava" in "nabava po meri uporabnika". Osebno mi je še najbolj všeč ta zadnja, čeprav je povsem nova skovanka in kdo ve, kako jo bomo razumeli. Ni neposreden prevod angleškega termina in mi je mogoče zato bolj pri srcu.

Poznate ali uporabljate kak boljši izraz? Pričakujem vaše predloge in ideje!

ponedeljek, 8. oktober 2012

Korpus bibliotekarstva se je čez počitnice "zredil"

Ideja o besedilnem korpusu bibliotekarstva je zorela in se medila dalj časa, potem pa je korpus sredi leta 2011 vendarle zaživel in takoj postal na spletu tudi javno dostopen, najprej samostojno, kamlu pa tudi na blogu Bibliotekarska terminologija kot posebna stran. V kratkem času je zajel okrog 1,8 milijona besed iz več kot dvestotih slovenskih strokovnih in znanstvenih besedil s področja bibliotekarstva in se izkazal kot zelo koristno in praktično orodje pri slovarskem in terminološkem delu. Zanimanja je bil deležen tudi izven bibliotekarskih krogov.

Velik uspeh pa beležimo pri razvoju korpusa tudi letos! Bibliotekarska terminološka komisija je januarja v sodelovanju z Zvezo bibliotekarskih društev Slovenije prijavila projekt njegove nadgradnje na javni razpis s področja predstavljanja, uveljavljanja in razvoja slovenskega jezika (takrat še) Ministrstva za kulturo. Na projektni razpis JPR-UPRS-2012 je prispelo 84 vlog, strokovna komisija Ministrstva za kulturo za slovenski jezik je za sofinanciranje podprla 11 najviše ovrednotenih projektov in med njimi je bil tudi Korpus bibliotekarstva kot "vsebinsko ustrezen in prepričljivo predstavljen projekt z dobrim strokovnim zaledjem in perspektivnim razvojem."

Dopolnjevanje korpusa s skoraj 400 dodatnimi besedili, predvsem članki iz strokovne revije Knjižnica, je tako leta 2012 finančno podprlo Ministrstvo za izobraževanje, znanost, kulturo in šport v okviru Javnega razpisa za sofinanciranje projektov, namenjenih predstavljanju, uveljavljanju in razvoju slovenskega jezika v letu 2012 - JPR-UPRS-2012. To nam je omogočilo vključitev skoraj vseh danes v elektronski obliki dostopnih člankov iz te strokovne oz. znanstvene revije in popolno pokrivanje letnikov od 1997 do 2011, kot zanimivost pa še 22 člankov iz prvega letnika, ki je izšel 1957. Z dodanimi več kot 1,8 milijona besedami se je obseg korpusa podvojil in danes presega 3,6 milijona besed iz 626 strokovnih in znanstvenih besedil, grobo porazdelitev pa prikazuje spodnja razpredelnica.

BesedilBesed
     Celotni korpus 626     3.660.900     
     Doktorske disertacije 4     215.000     
     Magistrska dela 21     596.000     
     Diplomska dela 17     319.000     
     Revija Knjižnica 454     1.956.000     
     Organizacija znanja 31     102.000     
     Knjižničarske novice 21     40.000     
     Prispevki v zbornikih 59     212.000     
     Drugi članki in sestavki 9     13.900     
     Monografske publikacije 10     207.000     

Selektivni seznam za korpus potencialno zanimivih besedil obsega še okrog 150 doslej objavljenih enot. Korpus bo vključeval samo objavljena besedila, ki so že javno dosegljiva v elektronski obliki. Poudarek bo na analizi besedil, objavljenih v zadnjem desetletju, glede na možnosti pa kdaj tudi starejših. Vsekakor bo velika skrb veljala tudi vključevanju najnovejših spletno dostopnih besedil, žal pri tem pogrešamo predvsem zaključna dela študija bibliotekarstva. Dinamika dopolnjevanja bo odvisna od prostovoljnega dela sodelavcev in razpoložljivosti besedil v elektronski obliki.