ponedeljek, 24. december 2012

Prijetne praznike pa srečno, zdravo in uspešno še naprej!

Drage kolegice in kolegi,
bralci in obiskovalci bloga Bibliotekarska terminologija!

Ob prehodu starega leta v novo, ko se vsakič znova bolj ali manj uspešno pridušamo, kako bo naslednje leto vse boljše in drugače, se vam zahvaljujem za dosedanji obisk in pozornost ter vas vabim, da ostanete z nami še naprej in tudi sami predlagate teme in vprašanja ali kar sami kdaj kaj napišete, z veseljem bomo objavili.

V teh tudi za našo stroko burnih in nemara kar prelomnih časih vam želim prijetno praznovanje in mnogo zdravja, sreče in osebnih pa tudi strokovnih uspehov v prihajajočem letu!

Janez

petek, 21. december 2012

Metaforika digitalnega prostora


The Web – pajčevina
Zgodnje avgustovsko jutro na zaplanski košenici, 2012
Pred težko pričakovanimi prazniki in ob tem še napovedanem koncu sveta (kar koli bo pač prej!) se lotevam nekoliko lagodnejše in bolj sproščene teme, take, ki najbrž ne more sproži pomislekov pa tudi provokativna ni, da bi od tega koga žulj bolel. Ob prebiranju literature o specializiranih besedilnih korpusih me je pritegnil članek o tvorbi terminov na področju računalništva in sprejemanju že znanih besed iz okolja, ki so ob tem pridobile v računalništvu nov pomen (Izwaini, Sattar: A corpus-based study of metaphor in information technology), in slikoviti metaforiki, ki je prav za računalništvo zelo značilna (SSKJ: metáfora -e ž (á) lit. besedna figura, za katero je značilno poimenovanje določenega pojava z izrazom, ki označuje v navadni rabi kak drug podoben pojav). V preteklosti so že mnogi avtorji ugotavljali, da metaforika v strokovnem jeziku odraža razvoj in "stanje duha" na določenem strokovnem ali znanstvenem področju in tako zaznamuje predvsem novejše panoge in dejavnosti. Analiza korpusa angleških besedil s področja informacijske tehnologije, ki obsega okrog 7 milijonov besed, kaže bogat nabor terminov, ki se sicer uporabljajo v splošnem jeziku v zvezi z živimi bitji, z delavnicami in pisarnami, gradbišči in delovišči, morjem in celo v vojaškem življenju. Tudi naša knjiga sodi v to zbirko metafor.

Avtorjeve ugotovitve na kratko povzemam v spodnji tabeli, pri tem pa sem zaradi večje ilustrativnosti ostal pri angleških izrazih, ker bi slovenjenje ponekod zabrisalo osnovni smisel.

 

      Živo bitje assistant, awake, bug, client, communicate, conflict, deamon, dialogue, freeze, generation, hibernation, host, language, memory, mouse, protocol, syntax, widow/orphan, proxy, sleep, spine, virus, web, wizard, worm
      Delavnica device, download, equipment, hardware, install, installation, load, template, utility, task, tool, workstation
      Pisarna archive, attachment, copy, desktop, directory, document, erase, file, folder, library, mail, page, trash, trash can, wastebasket, write
      Gradbišče, delovišče access, address, architecture, destination, firewall, gateway, harvest, home, location, mining, sign in/log in, sign out/log out, platform, port, portal, site, storage, visit, wallpaper, window, workstation
      Cesta access, block, bus, highway, map, path, shortcut, speed, superhighway, traffic, transport
      Knjiga bookmark, browse, browser, page, publish, read, write
      Morje flow, navigate, pirate, stream, surf
      Vojaški svet attack, combat, command, cracking, delete, disable, escape, instruction, password, save, security, target, war, warfare

četrtek, 13. december 2012

Bibliotekarstvo osvaja Termanio!

Prav te dni mineva eno leto, kar sem oznanil, da je Bibliotekarski terminološki slovar že javno dostopen na portalu Termania, danes pa z veseljem napoved razširjam in dopolnjujem – na slovarskem portalu Termania je odslej tudi Angleško-slovenski slovar bibliotekarske terminologije, ki ga je marsikdo med vami doslej gotovo že uporabljal bodisi tukaj na blogu Bibliotekarska terminologija ali na izvirni lokaciji, kjer ga je leta 2002 objavila Narodna in univerzitetna knjižnica. Ob vse večjem pojavljanju spletnih slovarjev na enotno organiziranih spletnih portalih in ob uporabi enotnega uporabniškega vmesnika smo se tudi pri tem slovarju odločili stopiti na pot tehnološkega poenotenja. Narodna in univerzitetna knjižnica je kot založnik dovolila prenos slovarja v novo okolje in spletno objavo vzporedne izdaje, Bibliotekarska terminološka komisija je dodala znanje, izkušnje in nekaj neprespanih noči, pri Amebisu pa so z dosedanjimi bogatimi izkušnjami izvedli konverzijo in namestitev v svoje okolje slovarskega portala Termania.

Na portalu Termania sta dva bibliotekarska terminološka slovarja.

Že obstoječa in leta 2002 na spletu prvič objavljena slovarska zbirka je bila načrtovana in strukturirana tako, da omogoča natančen in konsistenten izvoz podatkov v druge sisteme, Amebisova specializirana programska orodja in že razvita platforma prosto dostopnega portala Termania pa omogočata prav tak uvoz naših podatkov. Za računalniške sladokusce naj omenim, da je slovar začel nastajati pred dolgimi leti še na znameniti "Mavrici" ZX Spectrum in je uspešno prestal vse migracije na novejšo strojno in programsko opremo, vključno z obilico različic operacijskih sistemov.

Termania je prosto dostopen spletni slovarski portal, namenjen predvsem iskanju po slovarskih zbirkah, njegova prednost pred drugimi slovarskimi portali je predvsem v tem, da so na enem mestu preko enotnega vmesnika na voljo slovarji povsem različnih tipov in struktur, in to ne samo za uporabniško iskanje, temveč tudi z možnostjo urejanja in gradnje slovarjev za urednike. Na portalu je že dostopnih nekaj pomembnih slovarjev (npr. SSKJ, Slovenski pravopis, Presisov večjezični slovar ipd.), ki pa so predvsem splošni, zato je smiselno dodali tudi čim več terminoloških slovarjev, za katere je precej zanimanja predvsem strokovne javnosti. Mednje sodita tudi Bibliotekarski terminološki slovar in Angleško-slovenski slovar bibliotekarske terminologije, ki ju želimo ponuditi uporabnikom ob hkratnem dostopu do vseh ostalih zbirk. Na uspeh, da sta med temi prosto dostopnimi spletnimi slovarji tudi dva bibliotekarska slovarja, smo upravičeno ponosni.

Na portalu Termania je trenutno 26 slovarjev, zadnji je bil dodan decembra 2012 (predstavitev portala), že nekaj časa jih je mogoče uporabljati tudi na mobilnih napravah. Termania za Android je brezplačen odjemalec za dostop do novega Amebisovega spletnega slovarskega portala Termania, na katerem so prav tako brezplačni enojezični (npr. SSKJ, Slovenski pravopis, medicinski slovar ipd.) in večjezični slovarji (angleški slovar, nemški slovar ...).

         

Termania za Android, brezplačna aplikacija

Slovarje je mogoče za silo uporabljati tudi z vsakim povsem preprostim pametnim telefonom

sobota, 08. december 2012

Rudarjenje malo drugače


© Vlaki.Info
Obvladovanje ogromnih količin podatkov, s katerimi se je soočal, je za človeka vedno predstavljalo izziv, ki ga je dokaj uspešno reševal, čeprav včasih z zamudo. Zadnja desetletja so bila tako v duhu podatkovnih zbirk različnih vrst in tipov, poudarek pa je bil poleg organizacije in hranjenja podatkov predvsem na učinkovitem dostopu do njih, kar so reševale različne oblike iskanja in poizvedovanja (o terminološkem enačenju in/ali razlikovanju izrazov find/search oz. slovenskih ustreznikih iskati/poizvedovati kaj več kdaj drugič). Danes zaradi vse večjih potreb po učinkovitem dostopu do kakovostnih in povezanih podatkov in informacij tudi to več ne zadošča, pojavilo se je podatkovno rudarjenje. Definicij podatkovnega rudarjenja je mnogo in gledajo nanj z različnih uporabniških zornih kotov, vse pa imajo skupno osnovno pojmovanje.

Podatkovno rudarjenje je postopek avtomatiziranega raziskovanja, analize ter odkrivanja značilnih in pomembnih vzorcev, modelov in zakonitosti ter znanja iz ogromne količine podatkov, shranjenih v podatkovnih zbirkah, podatkovnih skladiščih in drugih informacijskih odlagališčih. Najbolj znane metode podatkovnega rudarjenja so statistične metode in metode z nevronskimi mrežami, ki izvirajo iz raziskav strojnega učenja na področju umetne inteligence. Samo skladiščenje podatkov, že znana poizvedovanja in obdelava podatkov, informacijski sistemi za podporo odločanju, vizualizacija podatkov ipd. ne sodijo v podatkovno rudarjenje.

Kot smo tega že vajeni, se je v začetku slovenščina oklenila angleškega izraza data mining, vendar so se mu kmalu pridružili tudi poizkusi slovenjenja kot so odkrivanje zakonitosti v podatkih, rudarjenje podatkov, rudarjenje po podatkih, podatkovno rudarjenje, izkopavanje podatkov, izkop podatkov, kopanje podatkov, kopanje po podatkih, iskanje podatkov, izkoriščanje podatkov, odkrivanje podatkov in še kaj. Kot kaže, sta se najbolj udomačila in razširila podatkovno rudarjenje (v korpusu GigaFida 79 pojavljanj, Nova beseda 24, Korpus bibliotekarstva 34) in rudarjenje podatkov (GigaFida 42 pojavljanj, Nova beseda 20, Korpus bibliotekarstva 0).

Islovar, terminološki slovar informatike, se je odločil za oba, vendar je dal prednost podatkovnemu rudarjenju, ki ima zato razlago, in podredil sopomenko rudarjenje podatkov, ki zato v slovarju ostaja brez razlage in ima samo kazalko na prvega. Glede na vrsto obravnavanih podatkov navaja slovar še nekaj sestavljenk in seveda vse sopomenke:

  • besedilno rudarjenje -ega -a s (ang. text mining) gl. rudarjenje besedil
  • izkopavanje podatkov -a -- s (ang. data mining, datamining) neustr., gl. podatkovno rudarjenje
  • odkrivanje zakonitosti v podatkih -a -- -- -- s (ang. data mining, datamining) gl. podatkovno rudarjenje
  • podatkovno rudarjenje -a -- s (ang. data mining) odkrivanje vzorcev v množici podatkov, ki navadno sloni na statističnih metodah ali metodah strojnega učenja; sin. odkrivanje zakonitosti v podatkih, rudarjenje podatkov
  • podatkovno rudarjenje besedil -ega -a -a s (ang. text mining, text data mining) podatkovno rudarjenje v veliki količini besedil; sin. rudarjenje besedil
  • podatkovno rudarjenje spleta -ega -a -- s (ang. web mining, web data mining) podatkovno rudarjenje po podatkih, dostopnih na spletu; sin. rudarjenje spleta,spletno rudarjenje
  • rudarjenje besedil -a -- s (ang. text mining) podatkovno rudarjenje v veliki količini besedil; sin. besedilno rudarjenje; prim. rudarjenje spleta
  • rudarjenje podatkov -ega -a s (ang. data mining) gl. podatkovno rudarjenje
  • rudarjenje spleta -a -- s (ang. web data mining, web mining) podatkovno rudarjenje po podatkih, objavljenih na spletu; sin. podatkovno rudarjenje spleta, spletno rudarjenje; prim. rudarjenje besedil
  • rudarjenje toka podatkov -a -- -- s (ang. stream data mining, data stream mining) podatkovno rudarjenje v podatkovnem toku
  • spletno rudarjenje -ega -a s (ang. web data mining, web mining) gl. podatkovno rudarjenje spleta in rudarjenje spleta

petek, 30. november 2012

Lažni prijatelji v infografiki


© The Wooden Table
Pred kakim mesecem dni sem v sestavku Lažni prijatelji spregovoril o teh varljivih parih besed ali fraz v dveh jezikih ali narečjih, ki so na pogled enake ali zelo podobne, vendar imajo različen pomen. V ilustracijo in za boljše razumevanje pojava sem podal tudi nekaj primerov lažnih prijateljev med slovenskimi besedami in petimi slovanskimi jeziki. Ta varljivi občutek, da marsikaj razumemo in celo znamo povedati, se lahko včasih hitro spreobrne v zadrego, ko v tujem jeziku uporabimo povsem napačno besedo in se tega nekaj časa niti ne zavedamo ali smo celo ponosni, kako lepo smo povedali - šele zaprepaščen pogled ali muzajoč se nasmeh sogovornika da vedeti, da je nekaj hudo, hudo narobe (npr. poison in poisson – prvo je v angleščini strup, drugo za Francoze riba; da je zadeva še bolj zapletena, je v pouličnem argoju to tudi poimenovanje za zvodnika!). Malo za šalo in malo zares pišejo o tem tudi nekateri jezikovni blogi, tu in tam pa je lahko kakšno opozorilo celo v jezikovnem priročniku za popotno rabo. Da ni predolgočasno, pride prav tudi infografika in v nadaljevanju navajam dva primera, enega za nekaj različnih jezikov in drugega za francoski jezik.

 

Vir: "Pimsleur Approach": 8 Most Frightening Foreign Language Faux Pas

Vir: "Pimsleur Approach": The 5 Most Dangerous Faux Amis

sobota, 24. november 2012

Kako se reče . . . ?

1. Flip-book

Nekateri med bralci se prav gotovo še spomnite, kako smo, takrat še v prevladujoče analognem otroštvu, mulci z grafitnim svinčnikom v majhno beležko narisali nekaj zaporednih sličic, ki so ob pregibanju zvežčiča pričarale vtis gibljivih slik, lastne "risanke", ki je pričarala nasmeh na otroška lica in prižgala iskrice sreče v občudujočih očeh avtorja in gledalcev. Če ni bilo beležke, in dostikrat je ni bilo, sta prišla prav dva papirna trakova, na vsakem je bila ena sličica, en trak je bil za podlago z osnovno sličico in drugi navit okrog svinčnika s sličico, ki je vdahnila učinek gibanja. In je mulc na sličicah v nedogled bincal policaja v zadnjico, metal žogo v staro ženičko, privzdigoval deklici krilce ali še kaj bolj neumnega . . . Pač časom primerno avtodidaktično gradivo! Kolikor se spomnim, ta pogruntavščina ni imela kakega svojega imena, pač sličice.

Tudi slovensko bibliotekarstvo, kolikor vem, tovrstnega gradiva ni poimenovalo, čeprav gre lahko tudi za tiskano in komercialno založeno gradivo za otroke in tudi za odrasle, po svetu so tudi za to specializirane založbe. Gre za nekaj lističev, lahko tudi zajeten snopič, z risbami, slikami, lahko tudi fotografijami, ki si sledijo z majhnimi spremembami in ob hitrem listanju (kretnja kvartopirca s palcem) dajejo vtis, da se ljudje in predmeti na slikah premikajo. Svoje geslo ima tovrstno gradivo tudi v Wikipediji, tem knjižicam pa je posvečeno tudi posebno spletno mesto Flipbook.info s podatki o več kot sedem tisoč primerkih, ki so izšli po svetu v zadnjem stoletju in pol, bogat pa je tudi opis njihove zgodovine in razvoja.

V angleščini sta v uporabi predvsem poimenovanji flip book (tudi flip-book) in flick book, prva taka knjiga naj bi menda nastala leta 1868, vsaj patentirana je bila takrat. Izraz so prevzeli tudi Francozi, čeprav imajo svoje folioscope, kineograph(e), feueilletoscope in cinéma de poche; v britanski angleščini sta še termina flick book in flicker book, v nemščini pa poleg anglicizma srečamo še Abblätterbuch in Daumenkino. Tudi španščina daje prednost angleški izposojenki, čeprav ima svoja termina folioscopio in mešanko libro flip.

Ste že zasledili, ali pa mogoče celo uporabljate za njih slovenski izraz?

2. Flipping book

V zadnjem času se je s popularizacijo elektronskih knjig in programov v stilu "napravi sam elektronsko knjigo" zgoraj obravnavanemu terminu pridružilo še nekaj zelo podobnih, ki prav gotovo ne pripomorejo k jasnemu (spo)razumevanju, to so flippingbook, flip book, flash book, page flip in gotovo se je še kakšen izmuznil moji pozornosti. Gre za obliko na spletu objavljene elektronske knjige, navadno nastale iz datoteke formata .pdf, ki bralcu ponuja elektronski približek občutka dela s fizično knjigo tako, da je po njej mogoče listati, "prijeti" in obračati liste, ki se upogibajo na vogalih in celo povzročajo šum, podoben šumenju papirja.

Listanje po knjigi ob šelestenju papirja
FlippingBook Realistic Digital Publications

Najnovejša iz naših logov; Knjižni čar 2013

Slovenski bibliotekarji, kako poimenujete tovrstne dokumente, da jih (vsaj za uporabnike) ločite od navadne "ploske" pdf datoteke?

ponedeljek, 19. november 2012

Prihaja za e-knjigo še t-knjiga?


© dbw
Termin tiskana knjiga je nehal biti zanimiv tisti trenutek, ko se je tisk dodobra razširil in uveljavil in so bile praviloma vse knjige samo še tiskane. Uporabljali smo ga predvsem še v primeru, da je bilo treba ločevati med tiskano in rokopisno knjigo, sicer pa ne več. In smo imeli mir slabega pol tisočletja!

Do trenutka, ko se je pojavila nova oblika knjige, ki smo jo poimenovali elektronska knjiga oz. okrajšano e-knjiga, ki je pogosteje v rabi. Oxford English Dictionary navaja za angleščino poleg izraza electronic book (termin je bil sprejet v slovar marca 2008, izpiski besedil s tem poimenovanjem pa segajo v čas po letu 1978) še variante E-book, e-book, eBook in ebook (v slovar so bile vključene leta 2001 in izpričane z izpiski od leta 1988). Kljub veliki popularnosti (prej izraza kot izdelka) je ta še danes slabo definiran (gl. npr. objavo E-knjiga in/ali digitalna knjiga? ali Kaj je e-knjiga in kaj to ni?), vendar se mu je kljub temu zaradi potrebe po razločevanju in/ali poudarjanju pred kratkim pridružila še nova skovanka - t-knjiga s pomenom tiskana knjiga. V angleščini najdemo najpogosteje p-book, zaslediti je mogoče tudi varianto pBook, vendar Oxford English Dictionary še nebene od njih ni zapisal. Angleško predpono p- navadno razlagajo s paper ali tudi print(ed), še pred knjigo pa smo jo začeli uporabljati za označevanje časopisja tudi v slovenščini (npr.: zmanjševanje števila p-naslovov na račun e-only . . .).
Primera rabe v slovenskih objavah:
. . . Posledično je v večini evropskih držav davek na t-knjigo od 0 do 8 %, na e-knjigo pa od 18 do 22 % . . .
. . . izdajati prevodne e-knjige le tako, da založniki stroške prevoda pokrijejo s prodajo t-knjige . . .
. . . je pri nas davek na e-knjige dvakrat višji kot na t-knjige . . .

              (Kovač, M.: Zakaj v Sloveniji ni resne ponudbe elektronskih knjig? Bukla 58, oktober 2010)
T-knjigo najdemo tudi v urniku Debatne kavarne ob letošnjem Slovenskem knjižnem sejmu (npr. v napovedi za dogodek Razvojni izzivi založnikov in knjižničarjev v luči prehoda od t-knjig na e-knjige). Slovenski slovarji in besedilni korpusi je še niso zabeležili.

Dovolj sočen in ilustrativen prikaz in razlago, kaj je p-book, podaja našim zanamcem (ki je mogoče več ne bodo poznali) Urban Dictionary.

nedelja, 11. november 2012

Lažni prijatelji


Naslova knjige ni težko dešifrirati:
"Tudi ti si lahko bogat"
V začetku jeseni me je pot zanesla na jugovzhod Evrope v deželo, ki v nekaterih podrobnostih nekoliko spominja na Slovenijo – je majhna, skozi vso zgodovino je bila na prepihu in podajali so si jo različni gospodarji, ki so ji vsiljevali svoje jezike in črkopis, bila je del velike večnacionalne in večkulturne države iz katere se je izvila pred dvema desetletjema v času tranzicije, sedaj se s sosedi puli za izhod na morje, njena največja reka se izliva v Donavo, ima mnogo vinogradov, odlična vina in največjo vinsko klet na svetu (tu nas je prekosila!). Nima pa svojega jezika. V ustavi je sicer kot uradni zapisan "moldovski jezik" (limba moldovenească), ki pa je v resnici romunski jezik in zanj uporabljajo izvirne romunske jezikovne priročnike pa tudi v šoli se pouk materinščine imenuje "romunski jezik". Nesrečni (sicer romanski) jezik je imel v obdobju 1938 do 1989 celo čast, da so ga pisali v cirilici! Ruščina, ki je bila v polpreteklosti poglavitni jezik vsakršnega komuniciranja, na ulicah glavnega mesta še danes prevladuje in rešuje izgubljenega, lačnega ali žejnega Slovenca, če je le toliko star, da se je v osnovni šoli še učil cirilico!

Romunščina je, kot vsi jeziki, skozi stoletja od sosedov ali naključnih gostov (tudi ko so prihajali v desettisočih na konjih in z okrvavljenimi sabljami) prevzemala nekatere besede, ki so še do danes ohranile zven svojega porekla. Ta pojav je bogatil tudi največje in najbolj razširjene jezike (za angleščino npr. sodijo, da ima okrog 30% besednjaka s francoskim pedigrejem, od Rusov pa so si izposodili npr. besede cosmonaut, mammuth, bridge (igra), novejši glasnost in perestroika, da o vodki in kaviarju ne govorimo). In kdor je gledal Naberšnikov Šanghaj, je gotovo opazil množico slovenskih besed v romščini. Enako v moldovski romunščini ni težko prepoznati nekaterih slovanskih, tudi Slovencu razumljivih besed. Prvič sem postal na to pozoren v knjigarni (kakopak, brez tega ni šlo, pred tem pa sem seveda že obiskal han (beseda mi ja znana iz bosanščine) ali pa cârciumă (ko izgovorijo, je presenetljivo podobno naši "krčma"), ko je bila pred menoj knjiga v romunščini, pogled pa je pritegnila beseda bogat, ki je bila tudi najpomembnejša beseda naslova (slika ob naslovu sestavka). Potem so se v kratkem času vrstile še druge znane besede, ki so pritegnile mojo pozornost in radovednost, npr. bogat – bogat, bolnav - bolan, ciorba - juha , drag – drag, gospodar – gospodar, grozav – grozen, hrean – hren, nevasta - žena, oglinda - zrcalo (ogledalo), pahar – kozarec, plata – plačilo, slab – šibek, târg – trg, tržnica, zid - stena, zid in še kaj.


Lahko razumljiv napis v knjižnici: "Plačljive storitve"

Pa vendar je z besedami tako, da lahko marsikaj tudi zakrivajo, človeka zavarajo in speljejo na nepravo pot. V jezikoslovju so to lažni prijatelji (false friends, falsche Freunde, faux amis, falsi amici). To so pari besed ali fraz v dveh jezikih ali narečjih, ki so na pogled enake ali zelo podobne, vendar imajo različen pomen. Tak pojav poznamo tudi v pisavi, npr. na pogled enake črke v latinici in v cirilici (npr. B, C, H, P ipd.), ki pa se berejo povsem drugače. Znana sta primera, ko so se srbski kolegi režali Slovenki, ki je bila po celodnevni konferenci trudna (v srb. noseča) in mladeniču, ki je ugledni gospe vljudno ponujal, naj sede na stol (v srb. miza), mi pa kolegici iz Zagreba, ki je občudovala našo avtocesto, da ima celo poseben pas za počasna vozila (hrv. častna vozila, tj. vozila s spremstvom). Še bolj je najbrž nerodno Portugalcu, ki v družbi razlaga svoje zdravstvene težave in podleže čaru lažnih prijateljev constipação (port. prehlad) in constipation (ang. zaprtost, zapeka). Lažna prijatelja sta tudi francoska librarie (knjigarna) in angleška library (knjižnica), v nemščini pa Gift (strup) in bekommen (dobiti), ki nimata nič skupnega z angleškima gift (darilo) in become (postati). Pa še nasvet za popotnike: če vas pot zanese v kraje, kjer prevladuje irščina in se odločite za "tapravi" irski pub, bodite zbrani, ko zapuščate mizo, fantje se odločite za kamrico z napisom F (fir – moški), dekleta pa za M (mna – ženske), sicer utegne biti nerodno! Drugi kraji, drugi običaji, ki nimajo s Feminine in Masculine nič opraviti.

Nekaj primerov lažnih prijateljev med slovenskimi besedami in petimi slovanskimi jeziki, namenoma sem izbral samo latinično pisavo (Vir: False Friends of the Slavist).

poljsko slovensko
biesiada pogovor, pomenek
doba dan
Dunaj Donava
grad toča
obraz podoba, slika
sklep prodajalna, trgovina
zapomniec pozabiti
češko slovensko
foukat pihati
kadit iti na veliko potrebo
otrok suženj
ŕeč govor
sklep klet
zapomenout pozabiti
zrak vid
slovaško slovensko
družina spremstvo
jed strup
krajši lepši
mrdat jebati
stanovať šotoriti
vrah morilec
záchod stranišče

hrvaško slovensko
grad mesto
konac nit
kraj konec
lice obraz
obraz lice
povijest zgodovina
sad sedaj
snaga moč
več že
srbsko slovensko
čas ura
dob starost
hlad senca
igrati plesati
kovčeg krsta
leto poletje
nedelja teden
vreme čas
zrak žarek


Isti napis v ruščini in v romunščini –
oba v cirilici.

Ciganka Zemfira,
Puškinova muza iz Besarabije.

Največja vinska klet na svetu.
Po njej se je treba prevažati z avtomobili.

Kdor se je pretolkel skozi cirilico,
bo razumel tudi to.

Tudi samovar poznajo vsi jeziki.
Tako se ga zakuri.

Kvas na vsakem koraku. Sveža, ledeno mrzla,
okusna, osvežujoča in (skoraj) brezalkoholna pijača.

sobota, 27. oktober 2012

Globinsko povezovanje

Časi so že taki, da se mi je na deževen in s predvolilnim golažem zapackan sobotni večer po sprehodu s psom zahotelo nekaj lahkotnega pa vendar dovolj pikantnega branja in kaj bi lahko bilo razmeram primernejšega kot malo kramljanja z Butalci. Tiskane knjige v ustvarjalnem kaosu delovne sobe nisem našel, tista elektronska pa je iz prve generacije slovenske elektronske založniške produkcije in na bralniku bolj slabo čitljiva, zato sem se odločil pobrskati po spletu in najti kakšno novejšo elektronsko izdajo. Ni jih malo, od brezplačnih ilustriranih ali tudi ne, do takih za dva evra, tiskane so v knjigarnah seveda desetkrat in več dražje. Z "guglanjem" ni bilo težav, šlo je hitro in neproblematično, našel sem, kar sem potreboval, in brez zapletov pretočil na svoj računalnik. Pa mi hudič ni dal miru in sem šel pobrskat še v katalog(e) naših knjižnic . . . in tam se je rodila ideja za današnji sestavek. Rekel bi, da iz stiske nemočnega uporabnika.

O tem, da je v opacu nemogoče izbrskati samo elektronske knjige in jih že v postopku iskanja ločiti od tiskanih, ne bi razpredal. To bi bilo danes nujno. Pravzaprav že včeraj. Ko sem silom prilik vendarle ročno izbrskal elektronske Butalce, se je zapletlo – v zapisu (slika levo) so lepo kot se spodobi nanizani različni ISBN-i za tri formate računalniških datotek, pa še nakaj podobnega, kar se lahko samo z nekaj znanja razšifrira kot UDK. In pod tem zagonetni stavek: Dostopna je elektronska verzija dokumenta ali pa gre za elektronski vir. Tudi po daljšem razmišljanju in ugibanju ne razumem, kaj mi je hotela knjižnica s tem povedati. Kaj je elektronska verzija in kaj elektronski vir?

No, prave težave so se začele šele sedaj – klik na hiperpovezavo v bibliografskem zapisu me je pripeljal na spletno stran založbe, kjer bi me morali čakati Butalci ali pa vsaj sporočilo, da je knjiga tam, vendar iz takih in takih razlogov nimam pravice do njene uporabe. Pa ne, prav na uvodno pozdravno stran sem prijadral! Tipičen primer neustrezne uporabe "navadne" (hiper)povezave tam, kjer bi morala biti ti. globinska povezava (varianta: globoka povezava). Domnevam, da je dal napačne podatke ob oddaji obveznega izvoda založnik. Temu v dobro štejem tudi to, da v desetih minutah brskanja po njegovem spletišču knjige vseeno nisem našel. So šli Butalci v ilegalo?

Kaj je globinsko povezovanje? To je uporaba hiperpovezave (ki se zato imenuje globoka povezava, globinska povezava), ki ne vodi na osnovno stran ali začetek dokumenta, temveč neposredno do lokacije v notranjosti – npr. do določene prosojnice v predstavitvi, odstavka ali slike v besedilu, izbranega dokumenta ali strani spletišča ipd. Ko se je splet začel razvijati, so zunanje povezave navadno vedno kazale na prvo stran spletišča oz. na začetek posameznih dokumentov. Kmalu pa se je pokazalo, da to ne zadošča, saj je navadno težko najti tisto mesto, ki nas res zanima, če vedno začenjamo z začetne strani. Tržne raziskave so npr. pokazale, da je prav ta težava, ki je posledica nepotrebnega dodatnega iskanja in tavanja, kriva za več kot četrtino neuspelih poizkusov spletnega nakupovanja. Tudi knjižnica, ki v novicah opozarja na nov cenik ali program izobraževanja, bo z globinskim povezovanjem popeljala uporabnike neposredno na ta dokument, ne pa na začetek domače strani knjižnice. Ilustrativni pimer navadnega in globinskega povezovanja v katalogu za isto knjigo je spodaj:


"Navadna" povezava popelje uporabnika samo na stran založbe – potem pa znajdi se!


Ustrezna globinska povezava pripelje uporabnika prav do elektronske knjige.

Tudi tokrat imamo težave s poimenovanjem v slovenščini. Najpogosteje je mogoče zaslediti kar angleški termin v slovenskem stavku, govorjenem pa tudi pisanem. Zelo redko (pa vendar) se pojavljajo tudi slovenski poizkusi ustreznic globinska povezava, globoka povezava in globinsko povezovanje, globoko povezovanje. Zanimivo je zapažanje, da se na spletu pojavljajo najpogosteje v določilih, vezanih na intelektualno lastnino in pogoje uporabe spletnih dokumentov, npr.:

  • Vzpostavitev povezav na posamezne podstrani spletišča *** d.o.o. brez jasne označbe porekla je izrecno prepovedana (globinsko povezovanje).
  • Globinsko povezovanje (deep linking) na fotografije objavljene v fotogaleriji ni dovoljeno.
  • Globinsko povezovanje (deep linking ) na fotografije objavljene v *** ni dovoljeno.
  • Izboljšana pa je tudi podpora za razvijalce programov, ki imajo sedaj poenostavljen proces registracije in možnost kreiranja »deep link« povezave do svojih aplikacij.
Tuji viri navajajo, da je bilo že precej odmevnih tožb na račun neustreznega povezovanja na strani komercialnih spletišč, ki tega ne dovoljujejo.

Zaradi podobnosti navajam še termine notranja povezava, notranje povezovanje, zunanja povezava, zunanje povezovanje, ki opredeljujejo "domet" povezave. Povezava z enega dokementa na drugega, z enega vira na drugega je zunanja, npr. povezava z bloga na Wikipedijo, s članka na slovar ipd. Povezava, ki vodi na drug del istega dokumenta ali vira, je notranja, npr. povezava med deli istega članka, objavami istega vira. Uporablja kdo med bralci kaj drugega, boljšega in ustreznejšega?

deep link- globoka povezava, globinska povezava
deep linking- globoko povezovanje, globinsko povezovanje
internal linking- notranje povezovanje
internal link- notranja povezava
external link- zunanja povezava
external linking- zunanje povezovanje

torek, 23. oktober 2012

Povezani podatki


© W3C
Mednarodni inštitut World Wide Web Consortium (W3C), ki ga je leta 1994 ustanovil Sir Tim Berners-Lee, znan predvsem kot izumitelj svetovnega spleta, in ki se uveljavlja s promocijo spletnih tehnologij in razvojem spletnih standardov, se že od leta 1999 intenzivno ukvarja s semantičnim spletom, ki bo (do neke mere je že) revolucionarno posegel v možnosti spletnega iskanja in priklica informacij. Ob semantičnem spletu, ki sloni na močno strukturiranih metapodatkih, ti pa omogočajo računalnikom razumeti zapletene odnose med objekti, se pojavljajo ključne besede Linked Data, Machine-Readable Web, Web of Data in Web 3.0. Nekaj let že poslušamo, da je semantični splet "takorekoč tukaj", vendar ga je Tim Berners-Lee oznanil kot dejansko dostopnega in uporabnega šele leta 2008. Ob tem pa ne gre zatiskati oči pred dejstvom, da se knjižnice v tem času še močno spopadajo s tehnologijami spleta 2.0 in bo do semantičnega spleta, znanega tudi kot splet povezanih podatkov, še dolga in bržkone trnava pot.

V računalništvu se uporablja termin povezani podatki takrat, kadar so podatki objavljeni in dostopni na tak način, da omogočajo sicer standardne spletne tehnologije logično in pomensko povezovanje podatkov iz različnih virov in v različnih oblikah s pomočjo strukturiranih metapodatkov, ki jih računalniki "razumejo" in za človeka izboljšajo kakovost iskanja in tako pridobljenih informacij. Termin je sicer skoval Tim Berners-Lee, vendar je sam pojav že dolgo znan na različnih področjih, v bibliotekarstvu na primer pri citiranju in citatnih indeksih ali v normativni kontroli.

Google Books Ngram Viewer kaže uporabo termina linked data v literaturi. Težko je seveda presoditi, kolikšen delež ima pri tem prosta zveze s pomenom "(kateri koli) podatki, ki so povezani" in koliko termin, ki je bil predstavljen zgoraj.

Kako pa je s slovenskimi poimenovanji? Kot prepogosto se v slovenskih besedilih, tudi strokovnih in znanstvenih, pojavlja termin kar v izvirni angleški obliki (npr. Uporaba pristopa linked data za integracijo porazdeljenih podatkov s spleta. Diplomska naloga, 2012; "Pristop Linked data po slovensko imenujemo pristop povezanih podatkov, vendar še ne obstaja splošno priznano slovensko ime, ker je celotno raziskovalno področje staro le nekaj let", ibid.), kar je seveda posledica precejšne novosti termina in ob tem negotovosti pisca, kaj in kako uporabiti v slovenščini. Na različne jezikovne vire se je težko opreti, saj pogosto naletimo na ti. prosto besedno zvezo (npr. Nova beseda: S terorizmom povezani podatki se namreč zbirajo v več kot dvajsetih . . . ), ki nima z našim terminom prav nobene zveze, zastopanost pravega termina pa je v korpusih Nova beseda, GigaFida, Konkordančniku za Islovar zelo majhna. V Korpusu bibliotekarstva se pojavi v dveh dokumentih iste avtorice, v reviji Knjižnica ga ni mogoče zaslediti, pač pa je nekaj malega v Knjižničarskih novicah, Organizaciji znanja in nekaterih časapisnih člankih (npr. Ustanovitelj interneta svari pred možnim vohunjenjem za aktivnostjo uporabnikov. Dnevnik, 15.3.2009) in tudi Opacu, ki kaže predvsem na zaključna dela ljubljanske in mariborske univerze. V okviru svojega letošnjega kongresa je IFLA pripravila 13. avgusta posebno okroglo mizo o povezanih podatkih, zato najdemo slovenski termin tudi v poročilu dr. A. Kavčič-Čolić pa tudi na nedavnem posvetu visokošolskih in specialnih knjižnic je bilo o tem govora.

Termin povezani podatki se je po tem sodeč že (sicer sramežljivo) "prijel" in ga uporabljamo v različnih strokovnih okoljih, ob njem pa še nekaj drugih:

linked data povezani podatki
open data odprti podatki
linked open data povezani odprti podatki, LOD
linked open library data povezani odprti podatki knjižnic
semantic web semantični splet
web of data podatkovni splet
web of linked data splet povezanih podatkov
Web 3.0 Splet 3.0


Kaj so povezani podatki?


Povezani podatki in knjižnice.

sobota, 13. oktober 2012

Po meri uporabnika?


© Publishers Communication Group
Izbor in nabava najprimernejših ter najpotrebnejših vsebin glede na ciljne skupine uporabnikov je izziv, s katerim se knjižnice srečujejo vse od svojega nastanka. Opiranje na znane potrebe uporabnikov je doslej temeljilo na knjigah želja, zasledovanju zahtevkov za medknjižnično izposojo, beleženju neizpolnjenih zahtev na izposoji in podobnem. Pojav elektronskih knjig in splošna razširjenost uporabe elektronskih bralnikov, prenosnih računalnikov in predvsem tabličnih računalnikov ter celo telefonov za branje elektronskih knjig ponujajo knjižnicam nove možnosti za učinkovitejše in predvsem bolj ekonomično zadovoljevanje potreb uporabnikov.

PDA (Patron-Driven Acquisition) je hitro naraščajoča metoda oz. poslovni model organizacije nabave knjižničnega gradiva, predvsem elektronskih knjig. Po tem modelu knjižnica kupi (v nekaterih primerih "najame" oz. zagotovi dostop) samo knjige, do katerih so uporabniki pred tem že želeli dostopati oz. so jih celo že uporabili. V praksi to pomeni, da bo knjižnica kupila manj "nepotrebnih knjig" (po metodi "just in case"), dejanski nakup pa se časovno zamakne, saj je bila knjiga "v obtoku" in uporabi že pred nakupom. Knjižnica torej več ne gradi velike stalne zaloge knjig, ki jih kupuje na osnovi predvidevanja, kaj bi uporabniki utegnili potrebovati in zahtevati, pač pa na osnovi dejanskega že izkazanega interesa uporabnikov. Predvidevanja knjižnice so lahko napačna, po drugi strani pa postaja tradicionalna izgradnja knjižnične zbirke vse manj smiselna tudi po ekonomski plati zaradi zmanjševanja proračuna in rasti cen, ko prihaja do vse večjega razkoraka med potrebami in (z)možnostmi. Doslej veljaven model izgradnje knjižnične zbirke več ne zdrži kritične presoje.

PDA sloni na enostavnem mehanizmu: v danes že prevladujočem digitalnem okolju pripravi knjižnica v sodelovanju s ponudniki vsebin svojim uporabnikom širok nabor naslovov, ki pa jih še ne kupi. Uporabniki po njih brskajo in iščejo ali že preberejo, kar jih zanima oz. kar potrebujejo, ko pa uporaba preseže določen prag (določeno število pregledanih strani e-knjige, prenos e-knjige ali članka na uporabnikov računalnik ipd.), bo knjižnica za to dobila račun in knjigo ali članek kupila, ne da bi uporabnik vedel, da je s svojimi dejanji vplival na knjižnično nabavo. Tak model nabave in uporabe virov omogoča po eni strani veliko večjo svobodo, izbiro in dostopnost gradiv, knjižnicam pa pomaga rešiti enega največjih problemov v preteklosti – (ne)uspešno odločanje o nabavi in riziko nakupa nepotrebnega gradiva ob pomanjkanju tistega, kar uporabniki dejansko potrebujejo in česar model nabave "just in case" ne zagotavlja. DeGruyter je lansko leto v raziskavi o PDA ugotovil, da okrog 40% knjig, ki jih kupijo visokošolske knjižnice, ni nikoli izposojenih, naslednjih 40% pa je izposojenih manj kot trikrat (kar potrjuje predpostavke informacijskih zakonov 80:20).


Po podatkih PCG je uporaba na zalogo kupljene literature še slabša.

Dober ilustrativen primer PDA ponuja na primer EBSCOhost za elektronske knjige v treh poenostavljenih korakih:

  1. Knjižnica pripravi zbirko - v skladu s potrebami uporabnikov je treba izbrati potencialno zanimive in koristne naslove (npr. glede na specializirano založbo, strokovno področje ipd.)
  2. Uporabniki imajo možnost dostopa do zbirke in uporabe gradiva - knjižnica prenese bibliografske podatke v svoj katalog, da jih lahko uporabniki z brskanjem ali iskanjem najdejo in neovirano ter brez omejitev uporabljajo
  3. Knjižnica kupi samo uporabljene naslove - nakup elektronske knjige sledi, če uporabnik
    • Prenese e-knjigo na svoj računalnik
    • Lista po e-knjigi več kot deset minut
    • Preglede več kot deset strani e-knjige
    • Del e-knjige natisne, pošlje po e-pošti ali prevzame z ukazi "kopiraj&prilepi"
    Na tak način uporabnik z izposojo/uporabo e-knjige neposredno "sproži" njeno nabavo.
V angleščini srečujemo poleg zelo razširjene kratice PDA (in PGA – Patron Generated Acquisition) za tovrstno dejavnost najpogosteje še (pisano z vezajem ali s presledkom):
        patron driven acquisition
        demand driven acquisition
        user-driven acquisition
        economy driven acquisition
        user-driven purchasing
        reader- or patron-driven acquisition
in verjetno še kaj.

Kako pa v slovenščini? Na terminološki problem me je že pred dopusti opozoril mariborski kolega Igor in iz najinega modrovanja je nastala današnja objava. Kot (pre)pogosto smo tudi tukaj v zadregi in mencamo z angleško kratico ali si lomimo jezik z angleškim terminom v slovenskem stavku, kar seveda ne gre. V Korpusu bibliotekarstva (najnovejša verzija, ki vsebuje 3,6 milijona besed iz 625 strokovnih bibliotekarskih besedil), se pojavlja PDA samo dvakrat, obakrat v istem članku, objavljenem leta 2011 v reviji Knjižnica. Samo v tem članku je mogoče zaslediti tudi poizkus slovenjenja, čeprav le bolj opisno kot nakup glede na potrebe uporabnikov.

Viharjenje s kolegi je rodilo nekaj bolj ali manj neuspešnih predlogov kot npr. uporabniška nabava, uporabniško vzpodbujena nabava, uporabniško usmerjana nabava, nabava na pobudo uporabnikov, uporabniško vodena nabava, nabava, ki jo določajo uporabniki, nabava po meri uporabnika, pristop, ki izhaja iz uporabnika, k uporabnikom orientirana nabava, na uporabnike osredotočena nabava, od uporabnika spodbujena nabava, uporabniško zasnovana nabava in še kaj. Skratka nič uporabnega.

Pridevniško besedo driven (ali generated) navadno slovenimo kot (za)gnan, voden, orientiran, usmerjen, naravnan, vzpodbujen . . ., v nekaterih drugih podobnih primerih smo se doslej dokaj elegantno rešili tudi s samostalniškim pridevnikom (npr. command-driven – ukazen, menu-driven – menijski), v tem primeru pa to ne bi šlo (uporabniška nabava ne ustreza pomenu ali celo zavaja, da uporabniki sami nabavljajo knjige). Žal vsebinsko in pomensko ni ustrezna niti varianta z "usmerjen, orientiran, voden" - uporabniško usmerjena nabava (k uporabnikom orientirana nabava) je pravzaprav že ves čas tudi tradicionalna nabava z upoštevanjem potreb/želja uporabnikov, uporabniško vodena pa z upoštevanjem uporabnikovih predlogov oz. zahtev. "Uporabniško usmerjana nabava" (poudarjam razliko v pisavi! Pisano z "a") je od teh mogoče pomensko še najbolj blizu, vendar termin najbrž (vsaj sedaj) še ni jasen, enako "uporabniško vzpodbujena nabava" in "nabava po meri uporabnika". Osebno mi je še najbolj všeč ta zadnja, čeprav je povsem nova skovanka in kdo ve, kako jo bomo razumeli. Ni neposreden prevod angleškega termina in mi je mogoče zato bolj pri srcu.

Poznate ali uporabljate kak boljši izraz? Pričakujem vaše predloge in ideje!

ponedeljek, 08. oktober 2012

Korpus bibliotekarstva se je čez počitnice "zredil"

Ideja o besedilnem korpusu bibliotekarstva je zorela in se medila dalj časa, potem pa je korpus sredi leta 2011 vendarle zaživel in takoj postal na spletu tudi javno dostopen, najprej samostojno, kamlu pa tudi na blogu Bibliotekarska terminologija kot posebna stran. V kratkem času je zajel okrog 1,8 milijona besed iz več kot dvestotih slovenskih strokovnih in znanstvenih besedil s področja bibliotekarstva in se izkazal kot zelo koristno in praktično orodje pri slovarskem in terminološkem delu. Zanimanja je bil deležen tudi izven bibliotekarskih krogov.

Velik uspeh pa beležimo pri razvoju korpusa tudi letos! Bibliotekarska terminološka komisija je januarja v sodelovanju z Zvezo bibliotekarskih društev Slovenije prijavila projekt njegove nadgradnje na javni razpis s področja predstavljanja, uveljavljanja in razvoja slovenskega jezika (takrat še) Ministrstva za kulturo. Na projektni razpis JPR-UPRS-2012 je prispelo 84 vlog, strokovna komisija Ministrstva za kulturo za slovenski jezik je za sofinanciranje podprla 11 najviše ovrednotenih projektov in med njimi je bil tudi Korpus bibliotekarstva kot "vsebinsko ustrezen in prepričljivo predstavljen projekt z dobrim strokovnim zaledjem in perspektivnim razvojem."

Dopolnjevanje korpusa s skoraj 400 dodatnimi besedili, predvsem članki iz strokovne revije Knjižnica, je tako leta 2012 finančno podprlo Ministrstvo za izobraževanje, znanost, kulturo in šport v okviru Javnega razpisa za sofinanciranje projektov, namenjenih predstavljanju, uveljavljanju in razvoju slovenskega jezika v letu 2012 - JPR-UPRS-2012. To nam je omogočilo vključitev skoraj vseh danes v elektronski obliki dostopnih člankov iz te strokovne oz. znanstvene revije in popolno pokrivanje letnikov od 1997 do 2011, kot zanimivost pa še 22 člankov iz prvega letnika, ki je izšel 1957. Z dodanimi več kot 1,8 milijona besedami se je obseg korpusa podvojil in danes presega 3,6 milijona besed iz 626 strokovnih in znanstvenih besedil, grobo porazdelitev pa prikazuje spodnja razpredelnica.

BesedilBesed
     Celotni korpus 626     3.660.900     
     Doktorske disertacije 4     215.000     
     Magistrska dela 21     596.000     
     Diplomska dela 17     319.000     
     Revija Knjižnica 454     1.956.000     
     Organizacija znanja 31     102.000     
     Knjižničarske novice 21     40.000     
     Prispevki v zbornikih 59     212.000     
     Drugi članki in sestavki 9     13.900     
     Monografske publikacije 10     207.000     

Selektivni seznam za korpus potencialno zanimivih besedil obsega še okrog 150 doslej objavljenih enot. Korpus bo vključeval samo objavljena besedila, ki so že javno dosegljiva v elektronski obliki. Poudarek bo na analizi besedil, objavljenih v zadnjem desetletju, glede na možnosti pa kdaj tudi starejših. Vsekakor bo velika skrb veljala tudi vključevanju najnovejših spletno dostopnih besedil, žal pri tem pogrešamo predvsem zaključna dela študija bibliotekarstva. Dinamika dopolnjevanja bo odvisna od prostovoljnega dela sodelavcev in razpoložljivosti besedil v elektronski obliki.

nedelja, 30. september 2012

Kiberknjiga?


© ungweb
Študentka bibliotekarstva Tamara me je pred časom povprašala o izrazu cyberbook, ki ga je občasno mogoče zaslediti predvsem na spletu, in možnostih uporabe morebitne slovenske ustreznice. Izraz je ob poplavi sodobnih in predvsem tudi modernih poimenovanj nekoliko v senci, pojavlja se redkeje in nikoli razložen, pisan včasih skupaj kot ena beseda ali pa deljeno kot cyber book.

Predpona cyber- se uporablja v različnih pomenih in zaradi nenatančnosti ter nedorečenosti pogosto vodi v zmedo in nerazumevanje. Nekaj primerov rabe v angleščini: cyber-alert, cyber-bully, cybercafé, cyber-chase, cybercrime, cyber-dating, cyber fraud, cybergoth, cyberhate, cyberhomes, cyber nationalism, cyber law, cyber light, cybernetics, cyberpower, cyberpunk, cyber racism, cyber-safe, cyber-safety, cybersecurity, cybersex, cyberspace, cyberterrorism, cyberwarfare, cyber online jobs, cyber school in še kaj. Izraz cybernetics, ki ga kot kibernetika poznamo tudi v slovenščini, je skoval Norbert Wiener leta 1948, ko je izdal knjigo Cybernetics or Control and Communication in the Animal and the Machine. Uporabil ga je za opisovanje kompleksnih sistemov živalskega sveta in mehanskih omrežj, predvsem za samoregulatorne nadzorne sisteme. Z znanstvenimi dognanji in podvigi človeštva v vesolju se je pojavil še izraz cyborg s pomenom kibernetski organizem. Razširil se je predvsem z znanstveno fantastiko. Leta 1989 je izšla knjiga Cyberbooks znanega pisca znanstvene fantastike, kjer se avtor Ben Bova v futuristični satiri loteva usode založniške industrije po iznajdbi "kiberknjig", to je elektronskih knjig, ki odpravijo papir, tisk, distributorje in celo knjigotržce . . . Zveni znano!

Dictionary.com pojasnjuje nedoslednost in pisanost rabe predpone cyber- in pravi, da se uporablja predvsem za tvorbo sestavljenk s pomenom računalniški, omrežni, virtualno resničnostni, pomen pa se je razširil tudi na povsem druga področja, npr. zelo moderen (cyberfashion). Zato je raba predpon virtual, e-, cyber- pogosto sinonimna ali skoraj sinonimna, npr. v primerih kot so virtual communities ali cybercommunities in e-cash ali cybercash. The Free Dictionary v primerjavi rabe teh predpon pojasnjuje, da se uporablja e- pogosteje v komercialnih sferah spleta (e-business, e-commerce) cyber- pa za širše kulturno okolje rabe računalnikov in omrežij v človeškem doživljanju sveta (cybersex, cyberchurch, cyberspace). Raba se seveda hitro spreminja in težko bi bilo že sedaj postaviti zaneslivejše trditve o tem, kako se je (ali se bo) ustalila.

Kako je pri nas? SSKJ in Slovenski pravopis pravita takole:
kibernétika -e ž (ẹ́) veda, ki raziskuje podobnost med delovanjem strojev in živo naravo (SSKJ)
kiber- predpona s pomenom, ki se nanaša na umetne organizme, računalništvo, npr. kiberprostor (Slovar tujk)
V slovenščini je že precej zloženk ali sestavljenih poimenovanj s poslovenjeno predpono grškega izvora "kiber", navadno pisano kot dve besedi (npr. kiber generacija, kiber kriminal, kiber kultura, kiber seks, kiber napad ipd.) ali pisano tudi skupaj kot ena beseda (npr. kiberkriminal, kiberfeminizem, kibermedicina, kibernapad . . .) in celo poslovenjenke (npr. kiberščak za cybernaut). Le redko se pojavljajo njihovi slovenski ustrezniki (npr. spletna kavarna). Podobno kot v angleščini tudi pomen pridevnika oz. predpone ni vedno povsem enak (včasih spletni ali pa bolj omejen na elektronski, tudi virtualni in najbrž še kaj). V korpusih Nova beseda in GigaFida sem zasledil teh 42 poimenovanj:
kiber arhitekt, kiber čas, kiber deklica, kiber generacija, kiber gledališče, kiber insekt, kiber kavarna, kiber kič, kiber kirurg, kiber komandos, kiber kriminal, kiber kriminalci, kiber kultura, kiber mesto, kiber monstrum, kiber napad, kiber novice, kiber partner, kiber policija, kiber potrošnik, kiber prijatelj, kiber prostor, kiber psihiater, kiber salon, kiber seks, kiber spolnost, kiber svet, kiber terapija, kiber terorist, kiber terorizem, kiber thriller, kiber trg, kiber umetnik, kiber umetnost, kiber uslužbenec, kiber varnost, kiber vdor, kiber vojna, kiber ženska.
Dokaj pisano in domiselno!

Kaj pa knjiga? Izraza kiberknjiga v slovenščini še nisem zasledil. Kolikor je mogoče razbrati iz angleške rabe, se uporablja cyberbook predvsem za naslednje:

  1. Kot sopomenka za e-knjiga oz. elektronska knjiga – tu z razumevanjem najbrž ni težav, slovenski izraz je dovolj udomačen in zadošča;
  2. Kot "buzzword", besedo, ki zveni trendovsko, moderno in pritegne pozornost, pogosto v naslovih (tudi knjigarn, založb, knjižnih klubov), vezanih na elektronske knjige; tako se imenuje npr. tudi norveška institucija, ki pripravlja in distribuira elektronska učna gradiva (zgoraj sem si sposodil njihov logotip);
  3. Cybook je tudi ime bralnika elektronskih knjig in Cyberbook serije prenosnih računalnikov;
  4. Kot "filozofski pojem" za oznako knjige, dokumenta, oblikovane vsebine itd. v t.i. elektronskem, spletnem, virtualnem prostoru (kiber prostor, cyberspace);
  5. Včasih tudi kot poimenovanje knjig z znanstveno fantastiko o kiber prostoru.
Če se vživim v študentkino kožo, je najbrž želela nasvet o tistem, kar sem navedel pod četrtim pomenom, torej "knjige, dokumenta, oblikovane vsebine itd. v t.i. elektronskem, spletnem, virtualnem prostoru (kiber prostor, cyberspace)". Če bom uporabil izraz "kiber knjiga" (ali kiberknjiga), me boste vi bralci pa tudi drugi moji kolegi najbrž linčali, elektronska knjiga in spletna knjiga pa nista povsem isto (celo ta dva se med seboj rahlo razlikujeta). Če uporabljamo kiber prostor in kiber kultura, tudi kiber knjiga ne bi smela biti prehud izziv za slovenščino . . . Ali pač? Kaj menite? Sprejmite izziv in se oglasite!

četrtek, 30. avgust 2012

Facepalm in palmface

Kljub poletni vročini in dopustniškim časom, ali pa prav zaradi tega, se je nabralo za terminološko razmišljanje in razpravo več gradiva, kot bi pričakoval. Tudi po elektronski pošti in na Facebooku smo kolegi modrovali, pač razmeram in času primerno pa bolj ležerno, značilno za ta poletni čas pa je, da smo se vsi mučili predvsem z angleškimi izrazi, za katere ne najdemo primernih slovenskih ustreznikov. Melita in Franc sta predlagala v razpravo "linked data", Igor "user driven", Tilen "facepalm", študentka Tamara "cyberbook" . . . da ne rečem, kje vse se je zatikalo meni. O teh terminih bom skušal v naslednjih tednih kaj napisati, za začetno ogrevanje po dopustu, ki ga zaključujem te dni, pa sem izbral tisto, kar nas je večina bralcev, poslušalcev in gledalcev, skratka "odjemalcev informacij" sredstev javnega obveščanja, čez poletje najpogosteje počelo – facepalm. Izjave in dejanja politikov, tistih poklicnih in tudi (nepoklicnih) kandidatov za najvišji slovenski stolček, dogajanja v podjetjih in na sodiščih, pa Črtomir in Bogomila . . . facepalmu se ni bilo mogoče izogniti!

Izraz (angleščina uporablja variante facepalm, tudi face-palm in face palm) ni nov in ga je mogoče zaslediti v slovarjih, res pa je, da je pridobil na popularnosti šele z internetnim žargonom. Opisuje značilno kretnjo, ko nekdo položi plosko dlan čez obraz ali spusti obraz v dlan ali obe dlani. To gesto poznajo različne kulture po svetu, povsod pa izraža močno čustvo frustracije, razočaranja, zadrege, sramu, presenečenja, nejevernosti, zaprepadenosti, gnusa, sramu, posmeha . . . Njegova spletna popularnost temelji na sceni iz 61. epizode TV nadaljevanke Star Trek, ko to znamenito gesto izvede Captain Jean-Luc Picard (6 min 11 sek). V medijih niso redke slike borznih posrednikov in neuspešnih poslovnežev, ki tako "opisujejo" finančno stanje ali finančni kolaps (povzeto po Wikipedia).

V internetnem žargonu je to "logičen" odgovor na neumno vprašanje ali izjavo oz. izraz žalosti, jeze ali besa, ko se zavemo napake ali trapastega dejanja. Pojavlja pa se tudi varianta "palmface", ki se lahko uporablja bodisi kot sopomenka ali pa ima nekoliko spremenjen pomen – v tem primeru kot odgovor na facepalm (dati svojo dlan na obraz sogovorniku, ki je pred tem izrazil posmeh tako, da si je z dlanjo pokril obraz – prva oseba je torej naredila facepalm, druga pa odgovorila s palmface) ( Urban Dictionary).

Kako pa je v drugih jezikih? Za nemščino sem zasledil frazo die Hände vors Gesicht schlagen, Francozi pa uporabljajo se taper la main sur le front, se taper la tête avec la main, se cacher la tête dans la main. Slovenščina pozna predvsem zakopati obraz v roke, zakopati obraz v dlani, skriti obraz v dlani in pokriti obraz z dlanmi, npr.:

- . . . Poliksenin lepi žalostni obraz. Ahil je zakopal obraz v roke in zajokal, ko je spoznal . . . (100 grških mitov za otroke, 2004)
- . . . Alica ni rekla ničesar, samo sedla je na tla, zakopala obraz v dlani in premišljevala, če . . . (Lewis Carroll: Aličine prigode v Čudežni deželi)
- . . . njegov govor kaže na obup (. . . obraz, zakopan v dlani) . . . (Wikiverza, analiza besedila).
Že dolgo znan pomen tako opisane geste je lahko enak, kot ga izraža "facepalm", vendar ne vedno. Pogosto je namreč povezana z žalostjo in jokom, ne pa posmehom in sarkazmom, ki sta danes poglavitno sporočilo v internetnem žargonu. Poleg tega je kretnja "facepalm" izvedena (navadno) z eno roko, slovenski izraz (tudi nemški) pa navadno predstavlja zakrivanje obraza z obema dlanema; francoščina pozna obe varianti.

Kako torej po slovensko? V internetnem žargonu se tudi v slovenskih besedilih korajžno pojavlja facepalm v izvirni obliki, pogosto mu sledi emotikon in/ali pomensko sorodna slengovska kratica (npr. ROFL). Najdemo ga seveda predvsem v krajših neformalnih sporočilih elektronske pošte, forumov in seveda tvitov, ali pa v proznih besedilih, ki opisujejo tako okolje. Kljub prizadevanjem nisem našel ničesar, kar bi kazalo na poizkus uporabe slovenskega izraza. Angleški izraz je dovolj kratek in enostaven (za pisavo in za izgovorjavo), njegova prednost pa je tudi v tem, da ima lahko ista oblika vlogo samostalnika (a quick facepalm), glagola (she facepalmed twice) in glagolnika (his facepalming upsets me). Vse to je pogosto ovira pri iskanju in kovanju ustreznika v slovenščini. Menim, da facepalm v kratkem ne bo dobil slovenskega ustreznika.

Pa vendar – Uporablja kdo med vami v takšnih situacijah kdaj tudi slovensko besedo ali frazo? Sporočite jo!

petek, 10. avgust 2012

Do kod osebni podatki?

Hudo poletno vročino je pregrel še en dogodek, ki pa je za marsikoga smuknil mimo kar neopazno, čeprav se je o njem pisalo v dnevnem tisku, čivkalo na Twitterju in Facebooku pa tudi blogi so ga zaznali. Najbolj pa so dogodek občutili seveda uporabniki korpusa Nova beseda, v katerega so letele strele. Za kaj gre?

Nova beseda, slovenski besedilni korpus, ki je sicer namenjen predvsem za slovaropisne potrebe Inštituta za slovenski jezik Frana Ramovša SAZU, kjer je tudi nastal, obenem pa tudi vsem drugim, ki se ukvarjajo z raziskovanjem slovenskega jezika in ga lahko na spletu prosto uporabljajo, se je začel julija letos čudno obnašati. Če je bilo v iskalni zahtevi osebno ime ali kaj osebnemu imenu podobnega (slovenski priimki so pogosto izpeljani iz poklicev od kovača do zidarja, kuharja in šuštarja, živali kot so zajec, medved, volk in sinica, pa tudi po narodih se imenujejo Lah, Nemec, Švab, Horvat, Turk, Rus ali so nastali iz domačih krajevnih imen, npr. Dolenc, Gorenc, Bohinc, Posavec in še kaj, da ne govorimo o "botaničnih" osebnih imenih, nastalih iz travica, bor, gaber, breza, ajda, marjetica, lan ipd.) se je skujal in ni hotel izpljuniti rezultatov ("Iskalni izraz: * * * vsebuje osebna lastna imena, zato zaradi varstva osebnih podatkov ne sme biti izveden."; Glej sliko pod naslovom). Vse to je posledica elektronskega sporočila, v katerem je nekdo aprila letos Informacijskemu pooblaščencu namignil, da naj bi upravitelji oz. avtor besedilnega korpusa ". . . kršil zakon s tem, ko je na svoji spletni strani http://bos.zrc-sazu.si/s_beseda.html, pod rubriko »Nova beseda«, brez privolitve objavil osebne podatke posameznikov, ki so primarno objavljeni v časopisu Delo . . .".

Nekdo se je torej prepoznal v stavkih, iztrganih in izoliranih iz člankov, v preteklosti objavljenih v dnevnem časopisju . . . kot tisti policaj pred leti v romanu tam na Koroškem.
Pooblaščenec je po prejemu navedenega obvestila zoper zavezanca, po uradni dolžnosti, uvedel postopek inšpekcijskega nadzora nad izvajanjem določb ZVOP-1 ter je dne 25. 4. 2012 po državnem nadzorniku za varstvo osebnih podatkov opravil ogled spletne strani in izdal Odločbo, v kateri je do potankosti in po korakih opisal iskanje, klikanje, dobljene rezultate in še kaj iz arzenala iskalnih strategij in postopkov ter uporabniškega vedenja (študentje bibliotekarstva pozor: učno gradivo!), nato pa sledi še usodna ugotovitev:
". . . da Nova beseda brez ustrezne zakonske podlage obdeluje osebne podatke posameznikov, ki jih je . . . torej mogoče na podlagi podatkov, ki so objavljeni v korpusu »Nova beseda« identificirati . . . Poleg tega je v korpusu »Nova beseda« objavljen tudi vir in datum izvornega članka, zato se lahko vsakdo, brez sorazmerno velikega napora, vloženega časa in brez stroškov, seznani s celotno vsebino članka . . . . V inšpekcijskem postopku je bilo ugotovljeno, da zavezanec brez ustrezne zakonske podlage obdeluje osebne podatke posameznikov, ki jih je mogoče brez velikih stroškov, nesorazmerno velikega napora ali veliko časa, neposredno identificirati. . . . zato je odredil, da . . . besedilni korpus »Nova beseda« na svoji spletni strani prilagodi na način, ki bo onemogočal kakršno koli iskanje besedil po imenu in/ali priimku posameznik."

Ukrep je korpus kastriral do te mere, da je bilo nemogoče poiskati kakršno koli osebno ime in njegovo pojavljanje v besedilih, kar sem tudi sam opazil in seveda postal pozoren na dogajanje. Sledili so bolj ali manj ukrepu nenaklonjeni članki v časopisju (npr. Prepovedana kovačeva kobila komentatorja Lenarta J. Kučića v Sobotni prilogi Dela, Grožnja temeljnim civilizacijskim pridobitvam dr. Mirana Hladnika v Delu ter nato odgovor informacijske pooblaščenke, problem je zaznal tudi blog. Po pritožbi in dogovarjanju ter usklajevanju v začetku avgusta so predstavniki obeh ustanov ugotovili in se strinjali, da " . . . način, na katerega je bila odločba najprej izvršena, ni optimalen z vidika uporabnosti besedilnega korpusa, z vidika varstva osebnih podatkov pa je pretiran . . . zato bodo skupaj iskali rešitve, s katerimi se bo na eni strani ohranila uporabnost in poslanstvo besedilnega korpusa, obenem pa zagotovilo varstvo osebnih podatkov". Korpus je sedaj nekje "na pol poti", posamezna imena je mogoče iskati, imena in priimka pa ne, izjeme so tudi nekatera tuja imena in še kaj. Skratka na tič ne miš, volk ni sit, koza pa tudi ne več cela!

Za primerjavo sem uporabil drugi (še večji) spletni korpus slovenskega jezika Gigafida; v zadnji številki Dela (7. avgust 2012) sem iz vidnejšega članka izbrskal ime in priimek osebe, ki ni politik, in poiskal v korpusu – 322 zadetkov, polno ime in priimek v sobesedilu! Z vsemi žgečkljivimi podrobnostmi. (Ime sem zakril jaz, nikoli ne veš . . .).

Res pa je, da nadaljnje brskanje poda samo skrajšan bibliografski opis (samo naslov časopisa, naslov članka in leto), v katerem ni številke časopisa in strani. Pri spletnih dokumentih je označeno samo "Interenet" – podcenjevanje, kot da ne znam "kopipejstati", porabil sem 5 sekund, Google pa še eno! Iskanje z istim imenom sem ponovil, tokrat v spletnem Delu in za zadnjih 7 let dobil 139 člankov z vsemi detajli o tej osebi, njenih znancih in prijateljih, še slike, taka portretna en face in s profila, pa cela postava, vse v barvah . . . V Dnevniku 45 člankov, 24ur.com 45 člankov, Google pa sploh darežljiv – kakšnih 44.000 zadetkov! Zdaj pa nečesa ne razumem . . . !

Nikakor ne oporekam prizadevanjem za varovanje in zaščito osebnih podatkov v kibernetskem prostoru (nekateri rečejo kar kiberprostor), saj se problema in posledic vse premalo zavedamo in prepogosto prihaja do nezaželenih presenečenj, kdo ve, kakšna nas še (že) čakajo! Celo zagovarjam in podpiram ohranjanje in varovanje zasebnosti. Me pa vržejo s tira prepovedi knjig (à la avtorice Gospe in zahtevane odškodnine, ki ji je sledilo uničenje knjige) ali dobljena tožba podeželskega policaja in pošteno oglobljen pisatelj! Pa vendar je v primeru korpusa situacija še nekoliko drugačna in specifična. Pustimo ob strani izobraževalni in raziskovalni namen, ki je gotovo najpomembnejši, vendar se zato še ni mogoče izogniti zakonu, in se posvetimo vsebini. Pomembno je to, da korpus ne zbira in ne obdeluje osebnih podatkov, pač pa že objavljena (t.i. ponovna raba ali reuse) in javno dostopna besedila, pretežno vzeta celo iz javnih občil, katerih namen je obveščanje in informiranje, objavljena v tiskani in elektronski obliki. Največja v korpusu zajeta celota so tri povedi (nikoli večji del besedila). Da pa " . . . se lahko vsakdo, brez sorazmerno velikega napora, vloženega časa in brez stroškov, seznani s celotno vsebino članka . . . ", je danes irelevantno, saj so vsa ta besedila (članki) na dosegu klika, če ne enega pa treh!

Že pred časom sem hotel spoznati to dimenzijo gradnje korpusov in s tem povezanih rešitev drugod, ob teh zapletih sem poskusil znova, vendar nisem nikjer zasledil ničesar podobnega. Osebne podatke in njihovo varstvo se večkrat omenja in celo izpostavlja kot zelo pomembno vprašanje, vendar samo v povezavi z avtorji, bodisi kot varstvo avtorskih pravic, pravic do zasebnosti za psevdonimom skritega avtorja in predvsem pri govornih korpusih pravica "avtorja", to je govorca, do zasebnosti oz. neodkrivanja njegove identitete. O osebah, ki se pojavljajo v objavljenih besedilih, nisem zasledil ničesar, poseben problem so seveda nekatera specifična besedila (npr. pravna, medicinska, ponovna uporaba osebnih podatkov v informacijah javnega sektorja ipd.). Nekateri korpusi niso povsem javno dostopni in zahtevajo pisno izjavo uporabnika o njegovem statusu in namenu uporabe, take so npr. International Corpus of English-Ireland, The English-Norwegian Parallel Corpus, francoski Base textuelle FRANTEXT in nemški NEGRA Korpus.

The British National Corpus omogoča iskanje po osebnih imenih in tudi lokacijo v besedilu podaja natančno, res pa je, da strani v dokumentu zelo pogosto ne navaja.

Vzporedni večjezični Linguistic Corpus of the University of Vigo, ki vsebuje ločene segmente za besedila s področja prava, znanosti in tehnologije, računalniška, literature, turizma in varstva potrošnikov, omogoča iskanje po osebnih imenih in tudi prikaz vira, ki je lahko zelo natančen (tudi v pravnem segmentu) ali pa bolj splošen, kot je prikazano na primeru zgoraj.

Švedski Korp, ki združuje iskanje po 85 manjših korpusih in obsega skoraj milijardo besed, je glede prikaza precej podoben našemu, omogoča iskanje po osebnih imenih in prikaže poleg osnovnih slovničnih podatkov tudi natančen vir, kjer je mogoče, tudi URL.

In kako je z osebnimi podatki v Korpusu bibliotekarstva? Ta zajema izključno strokovna in znanstvena besedila s področja bibliotekarstva, v katerih se, hvala bogu, pojavlja kaj malo oseb, tu in tam kak in memoriam ali visok jubilej, pa še teh je komaj kaj, sicer pa samo avtorji prispevkov (Vključena besedila). Seznami literature, ki spremljajo analizirana dela, pa ne pridejo v korpus.


Vir: design mind