sreda, 23. marec 2011

Bibliotekarski terminološki slovar na portalu Termania

Izid slovenskega Bibliotekarskega terminološkega slovarja konec leta 2009 pomeni nov mejnik v razvoju in dokončni uveljavitvi bibliotekarske stroke in znanosti pri Slovencih. Z njim sta dobili bibliotekarska in informacijska znanost tudi temeljno delo za svojo uveljavitev, večjo domačo in mednarodno razpoznavnost ter strokovno in raziskovalno delovanje. Izšel je v obliki dvojne redne številke 53. letnika revije Knjižnica, istočasno pa je delovna elektronska verzija javno dostopna tudi na spletu. Ob vse večjem pojavljanju spletnih slovarjev na enotno organiziranih spletnih portalih in ob uporabi enotnega uporabniškega vmesnika smo se tudi pri Bibliotekarskem terminološkem slovarju odločili stopiti na pot tehnološkega poenotenja. Z veseljem sporočamo, da je bila naša skupna prijava s podjetjem Amebis, ki je znano po svojih elektronskih slovarjih in jezikovnih orodjih, na Javnem razpisu Ministrstva za kulturo za sofinanciranje projektov, namenjenih predstavljanju, uveljavljanju in razvoju slovenskega jezika v letu 2011 - JPR-UPRS-2011 uspešna! Projekt “Bibliotekarski terminološki slovar na portalu Termania" sodi v tisto skupino izbranih projektov, katerih rezultat je širjenje uporabe slovenščine v informacijsko-komunikacijski tehnologiji. Cilj projekta je prenos Bibliotekarskega terminološkega slovarja, ki vsebuje več kot 6.500 bibliotekarskih terminov, na novi slovarski portal Termania do jeseni 2011.

Že obstoječa slovarska zbirka je bila načrtovana in strukturirana tako, da omogoča natančen in konsistenten izvoz podatkov v druge sisteme, Amebisova specializirana programska orodja in že razvita platforma prosto dostopnega portala Termania pa omogočata prav tak uvoz naših podatkov. Spletni slovarski portal podjetja Amebis je nastal predvsem zaradi terminoloških razlogov, njegov cilj pa je na enem mestu združiti (vsa) slovarska dela, tako enojezična kot večjezična. Portal Termania ponuja posameznikom, skupinam in organizacijam brezplačna osnovna orodja za interaktivno gradnjo in vzdrževanje slovarskih del, uporabnikom pa na drugi strani ponuja predvsem brezplačen dostop do vseh teh vsebin na enem mestu, preko enotnega iskalnika. Na portalu je že dostopnih nekaj pomembnih slovarjev (npr. SSKJ, Slovenski pravopis, Presisov večjezični slovar ipd.), ki pa so predvsem splošni, zato je smiselno dodali tudi čim več terminoloških slovarjev, za katere je precej zanimanja predvsem strokovne javnosti. Mednje sodi tudi Bibliotekarski terminološki slovar, ki ga želimo ponuditi uporabnikom ob hkratnem dostopu do vseh ostalih zbirk na slovenskem jezikovnem portalu Termania.
Kratka predstavitev portala v nastajanju.

O poteku in rezultatih projekta vas bomo seveda sproti obveščali.

sobota, 19. marec 2011

Prvi rojstni dan


Vir: Blogwerk
Te dni mineva leto dni, kar je zagledal luč sveta blog Bibliotekarska terminologija in dopolnil redke vrste slovenskih blogov s področja bibliotekarstva. Tako se je rodil tudi prvi slovenski blog, posvečen terminologiji neke stroke. Prva objava je sledila kmalu po izidu Bibliotekarskega terminološkega slovarja in tako uresničila želje avtorja, da bi se med slovenskimi bibliotekarji razvil živahnejši dialog o strokovnih vprašanjih bibliotekarske terminologije,ki bi omogočil učinkovitejše reševanje s tem povezanih vprašanj in dilem, saj jih ni malo. Blog izhaja iz skromne ambicije po rednem objavljanju enega ali dveh prispevkov mesečno, ki pa je bila kmalu presežena, v letu dni je bilo 48 objav in od jeseni je postalo redno tedensko objavljanje že skoraj pravilo. Prispevki so razglabljali o slovarjih in nekajkrat podrobneje o Bibliotekarskem terminološkem slovarju, o tiskanih in elektronskih slovarjih, o nekaterih izbranih bibliotekarskih terminih in poimenovanjih, predvsem takih, ki predstavljajo težave zaradi prehoda iz tujih jezikov, o problematiki razumevanja terminologije za uporabnike, o pojavnosti nekaterih terminov v strokovnih besedilih in ustreznikih v tujih jezikih, o poimenovanjih za bibliotekarje pomembnih merskih enot, vplivu angleščine na slovensko bibliotekarsko terminologijo, nekaj malega pa tudi o zgodovini in etimologiji nekaterih poimenovanj. Objave so navedene v kumulativnem predmetnem kazalu. Avtorju so se pridružile tudi štiri gostje, dve Slovenki in dve kolegici iz tujine, nemška bibliotekarka in ameriška terminologinja. S prispevkom v angleščini smo na povabilo iz tujine tudi mi gostovali na ameriškem terminološkem blogu, kjer je bil prispevek med bolj odmevnimi, prišlo pa je tudi že vabilo za članek v znanstvenem časopisu instituta za ukrainski jezik v Kievu. Po enem letu uspešnega "izhajanja" je čas, da pogledamo, kdo so bili obiskovalci bloga in koliko jih je bilo.

Kdo bere Bibliotekarsko terminologijo?

Nova vsebina na spletu ni ostala neopažena in v tem letu je bil zabeležen nadvse zadovoljiv obisk. Nenavadno dosti zanimanja je bilo tudi iz tujine, čeprav so objave praviloma samo v slovenščini. Podatki o obisku v absolutnih številkah so nezanesljivi, ker imajo različni števci vsak svojo metodologijo beleženja in poročanja, zato bomo vzeli kot merodajne podatke Google Analitics, ki spremlja uporabo bloga od samega začetka in omogoča tudi dokaj razvejane prikaze in primerjave, čeprav so nekateri drugi števci pokazali mnogo večji obisk in bi se lahko z njimi mnogo bolj pohvalili. V letu dni je števec Google Analytics zabeležil dostop 2,337 posameznikov iz 52 držav, ki so obiskali blog 4.810 krat in opravili skupaj 22.947 ogledov strani. Pretežno so bili to seveda Slovenci, pisana pa je tudi paleta obiskovalcev iz drugih držav, ki jim nekoliko pomaga razumeti vsebino namestitev avtomatskega prevajalnika Google Translate, saj je bil evidentiran dostop z brskalniki v 29 jezikih. Evidentirani so bili dostopi iz 192 mest, največje število obiskov je seveda iz Ljubljane (3,394), nato pa Maribora, Celja, Kranja in Kopra, sledi Beograd in od drugih tujih mest je Mountain View v Kaliforniji že na desetem mestu, potem kmalu sledijo še Moskva, Varšava, Bruselj in Sarajevo.

Sestavek o odprtem dostopu je s 723 ogledi 274 različnih bralcev nedvomno najbolj bran, sledita mu prispevka o merskih enotah za bibliotekarje, na četrtem mestu je predstavitev Bibliotekarskega terminološkega slovarja, prispevek ameriške kolegice pa je po obiskanosti peti. V povprečju so obiskovalci pregledali po 4,8 strani in ostali na blogu 4 minute in 2 sekundi.

Obiskovalci prihajajo skoraj z vseh koncev sveta

Zanimiv je pregled obiskovalcev glede na ti. zvestobo ali lojalnost (ang. loyalty), ki šteje vračanje istega bralca na spletno stran oz. blog. Med obiskovalci je 48% takih, ki se nikoli niso vrnili, ker jim vsebina ni bila zanimiva ali so imeli z razumevanjem jezika kljub možnostim avtomatskega prevajanja prevelike težave, več kot 34% pa je takih, ki so se vrnili desetkrat ali še več. Skupaj je 788 takih bralcev, ki se vračajo dokaj redno oz. so prišli na blog več kot petdesetkrat. V nadaljevanju je preglednica za Biblioblog, ki kaže za isto obdobje skoraj povsem enako strukturo bralcev in njihovega vračanja na blog ob približno štirikrat večjem skupnem številu obiskov.

34,4% bralcev se je vrnilo na blog več kot desetkrat, med njimi je takih 788, ki so prišli več kot petdesetkrat.

Primerjava z obiskovalci Bibliobloga v istem obdobju kaže ob sicer štirikrat večjem obisku v odstotkih skoraj identično
strukturo zvestobe bralcev, ki se vračajo.

Skladno s pričakovanji uporablja skoraj polovica obiskovalcev brskalnik IE, približno tretjina Firefox, vsak šesti Chrome, sledi pa še neznaten delež devetih drugih brskalnikov za osebne računalnike, evidentiranih pa je bilo tudi 25 dostopov s 6 vrstami mobilnih naprav. Skupaj 12 različnih operacijskih sistemov, vključno z mobilnimi napravami, predvsem prepričljivo seveda vodijo različne verzije Windows s 96,8%.

 

Blogu Bibliotekarska terminologija želimo uspešno nadaljevanje zastavljene poti, vas pa vabimo k branju, razmišljanjem in komentiranju! Če se bomo potrudili, bomo lahko skupaj prižgali tudi dve svečki.

petek, 11. marec 2011

Sto najpogostejših

Ko vzamem v roke slovar, se mi samo po sebi utrne vprašanje, koliko bogastva je v njem, koliko besed, koliko od tega je še neznanih. Profesionalna deformacija. Ta teden sem vsak večer preživel s slovarjem v roki, tistim klasičnim tiskanim slovarjem, že malo posivelim tam sredi obreze, kjer palec išče med listi . . . so že vedeli Angleži, zakaj so rodili izraz "to thumb" za naše opisno "obrabiti knjigo z listanjem"! Zakaj nisem segel po čem sodobnejšem? Ker pač tak, kot sem ga potreboval, v elektronski obliki še ne obstaja, ker je tiskani bogat in podroben, poln fines in mu elektronski bratec ne sega niti do kolen. Pa saj bo zrasel. Takrat bom segel po elektronskem. Ko torej vzamem slovar v roke, mi že občutek debeline, teže, bežen prelet prstov in oči med stranmi ustvari zadovoljiv vtis o tem, kaj lahko v njem pričakujem. Ko vstopim v neznan elektronski slovar, tega vtisa navadno ni, cederomi so vsi enako debeli in istega premera, pri spletnih je z izjemo redkih zaslonska slika precej podobna zaslonski sliki . . . nad tem sem se že pritoževal.

Ko pa vzamem v roke Bibliotekarski terminološki slovar, je seveda drugače, saj sva skupaj rasla. Ko smo kakšno geslo v delovni skupini zadovoljivo obdelali, sem bil jaz tista "tipkarica", vsak znak v njem je posledica pritiska mojega prsta na tipko, najprej Spectrumovo, pa Atarijevo in pecejevo, začelo se je z 286, če komu od mlajših bralcev ta zgodovinska številka še kaj pove, potem pa na novejših vse do prenosnega hapeja, s katerim je šlo potem v tisk in tudi na splet. Z malo sreče naj bi spletna verzija do poletja prešla v drugo okolje, ampak ministrstvo spet zamuja z rezultati razpisa . . .

Tokrat bom nanizal nekaj statističnih zanimivosti o obsegu, sestavi in strukturi Bibliotekarskega terminološkega slovarja. Če zanemarimo 40 grafičnih znakov (npr. #, [, ©, * ipd.), je obsegala podatkovna zbirka v času izida tiskane izdaje slovarja 6520 zapisov, torej prav toliko gesel oz. terminov in terminoloških zvez, dokaj razčlenjena podatkovna struktura zbirke pa je odraz različnih potreb, ki jih mora slovar izpolniti.

Pregled terminološke slovarske zbirke ponuja nekaj zanimivih osnovnih ugotovitev o zastopanosti besednih vrst:

  • 5.767 gesel (86%) ima označevalnik za spol, so torej samostalniki ali samostalniške zveze, od tega 2.486 moškega spola, 2.483 ženskega spola in 798 srednjega spola
  • glagolov je le 71, pri teh je označen tudi glagolski vid (24 dovršnih, 16 nedovršnih ter 31 dovršno in nedovršno)
  • 184 je kratic in 164 okrajšav
  • besednovrstno oznako ima 71 gesel, praviloma so to pridevniki - 68, po eden pa je predlog, prislov in veznik.
Teh 6520 gesel je sestavljenih iz 12.729 besed, z avtomatsko lematizacijo (lematizacija je proces pripisovanja osnovne oblike besednim oblikam v besedilu, npr. vse glagolske oblike spremenimo v nedoločnik, vse samostalniške oblike v imenovalnik ednine ipd.), za katero obstaja tudi v slovenskem jeziku že nekaj prav uporabnih spletnih programov, se je zmanjšalo število različnih besed na samo 3.016. Njihova pogostost je zelo različna, od 233 do ena, teh je največ. Zmagovalca sta nedvomno znana in povsem pričakovana, to sta knjižnica z 233 pojavljanji in knjižnični 186 pojavljanj, potem pa pogostost strmo pada. Dvanajsta najpogostejša beseda se pojavlja stokrat, petdeseta že pade pod pogostost 30, enaindevetdeseta je pod pogostostjo 20, na 210. mestu pa pogostost pade že pod 10. Od 1287. besede in naprej so besede, ki se pojavljajo samo še po enkrat, takih je 1721 (57%).


Skokovito upadanje pogostosti besed

Pri tovrstnih jezikovnih podatkih marsikdo pomisli na predpostavko Zipfovega zakona in se vpraša, ali velja tudi za ugotovitve v Bibliotekarskem terminološkem slovarju.

Primerjava teoretične Zipfove krivulje in dejanskih pogostosti
besed v slovarskih geslih
Zipfov zakon temelji na trditvi, da je majhno število besed uporabljeno zelo pogosto, mnogo drugih ali skoraj vse ostale pa zelo poredko. V svoji prvotni obliki označuje empirično ugotovitev harvardskega jezikoslovca Georga Kingsleya Zipfa, da je v vsakem naravnem jeziku pogostost n-te najpogosteje uporabljane besede približno recipročno odvisna od n. Klasičen zgled Zipfove funkcije je funkcija 1/f. Če množico po Zipfovem zakonu porazdeljenih pogostosti uredimo od najpogostejše do najmanj pogoste, bo pogostost druge najpogostejše ravno ena polovica pogostosti prve, pogostost tretje najpogostejše pa 1/3 pogostosti prve itn., tako da je pogostost n-te najpogostejše 1/n pogostosti prve (Wikipedia, Zipfov zakon)

Zipfov zakon velja predvsem za živi jezik, slovarsko gradivo pa seveda od tega odstopa, še toliko bolj, ker gre za terminološki slovar, kjer nekateri poudarki strokovne terminologije pa tudi razmišljanja uredniške skupine obidejo značilnosti in zakonitosti živega jezika za vsakodnevno komuniciranje. To ponazarja odstopanje teoretične in empirične krivulje na zgornjem grafu, vendar je očitno, da se trenda krivulj ujemata.

In kakšna je lestvica stotih najpogostejših besed, med katerimi je 72 samostalnikov in 28 pridevnikov? Vodi seveda knjižnica, pomenljivo pa je informacijski že na devetem mestu z več kot sto pojavljanji, takoj za petami pa sta mu podatek in informacija. Zelo visoko sta uvrščena tudi računalniški in elektronski.

Sto najpogostejših besed v geslih Bibliotekarskega terminološkega slovarja v razpredelnici in vizualiziranih v oblaku.

sreda, 2. marec 2011

Bibliometrija in bibliometrika

V sestavku Bibliometrija v oblaku sem pred kratkim opozoril na nedoslednost rabe nekaterih pogostejših tvorbeno podobnih izrazov, povezanih s terminom bibliometrija in njeno sopomenko, kamor sodijo tudi iz njih izpeljani pridevniki. Z vidika terminologije, ki skrbi za jasnost, nedvoumnost in natančnost sporočilnosti strokovnega jezika ter sporazumevanje v njem, so zato moteče terminološke dvojnice kot so bibliometrija / bibliometrika, scientometrija / scientometrika, informetrija / informetrika, bibliometrični / bibliometrijski, scientometrični / scientometrijski ipd.

Tokrat bom prikazal in primerjal dejansko rabo oz. omembo obravnavanih terminov v pomembnejših spletnih virih, predvsem slovenskem besedilnem korpusu ter nekaterih normativnih in informativnih slovarjih, ob tem pa tudi v strokovnih besedilih, ki so na razpolago v elektronski obliki, ali njihovo navedbo v računalniškem katalogu. Iskalnik Google sem tokrat namenoma izpustil, ker prihaja do prevelikega šuma pri dokumentih v drugih jezikih; bibliometrika npr. nastopa vsaj v 12 nam bolj znanih jezikih, pridevniki, ki se končujejo na -metrijski, pa so dokaj pogosti v srbščini in hrvaščini (vključno z bibliometrijski). Googlovo omejevanje iskanja na dokumente v določenem jeziku je za resno delo povsem neuporabno, ker žal avtorji svojih dokumentov prepogosto ne opremljajo z ustreznimi metapodatki za označevanje jezika dokumenta.

Zaradi inventarizacije terminoloških zvez, ki se uporabljajo v bibliometriji in v zvezi z njo, smo izpisali nekaj strokovnih besedil. Pregled izbranih razpoložljivih virov je pokazal, da se terminološki sopomenki bibliometrija in bibliometrika pojavljata v slovenskih strokovnih besedilih relativno redko. V Knjižničarskih novicah s tema terminoma povezanih objav nismo zasledili, v strokovni reviji Knjižnica je 5 člankov, v dLib.si že 19 enot in v COBIB-u kar 257 zadetkov, med njimi tudi diplomska in magistrska dela ter doktorske disertacije. Eden zgodnjih slovenskih člankov (4), povezanih z bibliometrijo, sega v leto 1984 in že uporablja termina bibliometrija in bibliometrijska analiza; objavljen je bil v reviji Knjižnica in tudi obravnava objave ter citiranost v Knjižnici. Tudi v angleškem jeziku je beseda bibliometrics, iz katere izhaja naša bibliometrija, novejša skovanka in jo je Oxford English dictionary prvič evidentiral v leta 1969 objavljenem članku (5) (Ranganathan je leta 1948 skušal uveljaviti termin librametrics). Z orodjem Ngram Google Books smo pripravili zanimiv grafikon pogostosti pojavljanja tega in še petih pomensko sorodnih terminov v posameznih letih (delež izbranega izraza med vsemi evidentiranimi besedami), pojavnost pa je seveda tudi odraz nabora literature, ki jo Google Books vsebuje za posamezno obdobje. Padec pogostosti pojavljanja po letu 2005 je samo posledica manjšega zajemanja najnovejših publikacij v Google Books.

Terminološki dvojnici bibliometrija in bibliometrika sta nastali najverjetneje istočasno po angleškem vzoru (bibliometrics), morebiti tudi nemškem (Bibliometrie) in takrat še srbohrvaškem (bibliometrija), izvirata pa iz grščine (biblos – knjiga, metrike techne – umetnost merjenja) in sta prišli v sodobne jezike preko latinščine. Ker v znanosti vse več merimo, je nastala cela vrsta sorodnih izrazov po istem tvorbenem vzorcu. Merimo knjige in objave – bibliometrija, znanstvene dosežke – scientometrija, informacije – informetrija, spletne objave – webometrija ali spletometrija (ang. webometrics in cybermetrics) in najbrž tu še ne bo konec. Pregled elektronskih virov kaže, da daje slovenščina pri poimenovanju strokovnih in znanstvenih panog po tej etimologiji prednost oblikam, ki se končujejo na –metrija in so le izjemoma po vzoru –metrika. Tudi besedila treh znastvenih objav s področja bibliometrije (1, 2, 3) dajejo prednost rabi termina bibliometrija in redkeje uporabljajo bibliometrika. V njih smo zasledili naslednjo pojavnost terminov: bibliometrija – 102, bibliometrika – 11, scientometrija – 44, scientometrika – 4, informetrija – 25, informetrika – 1. Podobno sliko kažejo tudi v vzajemnem katalogu opisani dokumenti (bibliometrija – 175, bibliometrika – 2), tudi Spletni splošni slovenski geslovnik pozna samo termin bibliometrija. Zato se je Bibliotekarska terminološka komisija glede na rabo v strokovnih besedilih, splošnem besedilnem korpusu in normativnih ter informativnih slovarjih odločila dati prednost terminom bibliometrija, scientometrija in informetrija ter podrediti sopomenke bibliometrika, scientometrika in informetrika.

–metrija ­–metrika bibliometrija bibliometrika
SSKJ 26 2 ne ne
Slovenski pravopis 30 2 ne ne
Besede slovenskega jezika 168 12 da ne *2
Besedišče slovenskega jezika 81 4 ne ne
Odzadnji slovar slovenskega jezika 27 2 ne ne
Nova beseda 57 *1 5 *1 3 *1 1 *1
Veliki splošni leksikon - CD-ROM 67 1 ne ne
COBISS/OPAC (ključne besede)
število bibliografskih zapisov
/ / 175 2
Tri izbrana znanstvena dela *3 / / 125 11

Pojavljanje izrazov v posameznih virih, februar 2011 (številke v prvih dveh kolonah so povezava na seznam besed)
*1 Upoštevaje lematizacijo pojavnih oblik
*2 Iskalnik jo sicer najde, vendar zaradi napake pri lematizaciji
*3 Juvan, Južnič, Kotar


Pogostost uporabe sinonimnih parov terminov v treh znanstvenih delih (Juvan, Južnič, Kotar)

Prihodnjič bodo na vrsti terminološke dvojnice pridevnikov bibliometrični / bibliometrijski, scientometrični / scientometrijski, infometrični, webometrični in še nekateri.

  1. Juvan, S.: Bibliometrična analiza kot podpora za gradnjo relacijske podatkovne baze na področju funkcionalnih živil. Magistrsko delo, 2004
  2. Južnič, P.: Metodološka osnova analize citiranosti in njena uporaba v Sloveniji. Doktorska disertacija, 1998
  3. Kotar, M.: Bibliometrijska analiza informacij v tekstilstvu in njihovo razširjenje. Doktorska disertacija, 2005 (avtoričin preprint)
  4. Popovič M., M. Ambrožič, P. Južnič: Nekaj značilnosti razvoja slovenskega knjižničarstva v novejšem obdobju. (Ob kvantitativni analizi člankov in referenc v reviji Knjižnica za obdobje 1974-1983). - Knjižnica, 28/1984, št. 3/4, str. 167-198
  5. Pritchard, A.: Statistical Bibliography or Bibliometrics?. - Journal of Documentation, December 1969
  6. Veliki splošni leksikon [Elektronski vir] / urednik Aleš Pogačnik. - Elektronska izd. na plošči CD-rom. - Ljubljana : DZS, 2005.