ponedeljek, 24. december 2012

Prijetne praznike pa srečno, zdravo in uspešno še naprej!

Drage kolegice in kolegi,
bralci in obiskovalci bloga Bibliotekarska terminologija!

Ob prehodu starega leta v novo, ko se vsakič znova bolj ali manj uspešno pridušamo, kako bo naslednje leto vse boljše in drugače, se vam zahvaljujem za dosedanji obisk in pozornost ter vas vabim, da ostanete z nami še naprej in tudi sami predlagate teme in vprašanja ali kar sami kdaj kaj napišete, z veseljem bomo objavili.

V teh tudi za našo stroko burnih in nemara kar prelomnih časih vam želim prijetno praznovanje in mnogo zdravja, sreče in osebnih pa tudi strokovnih uspehov v prihajajočem letu!

Janez

petek, 21. december 2012

Metaforika digitalnega prostora


The Web – pajčevina
Zgodnje avgustovsko jutro na zaplanski košenici, 2012
Pred težko pričakovanimi prazniki in ob tem še napovedanem koncu sveta (kar koli bo pač prej!) se lotevam nekoliko lagodnejše in bolj sproščene teme, take, ki najbrž ne more sproži pomislekov pa tudi provokativna ni, da bi od tega koga žulj bolel. Ob prebiranju literature o specializiranih besedilnih korpusih me je pritegnil članek o tvorbi terminov na področju računalništva in sprejemanju že znanih besed iz okolja, ki so ob tem pridobile v računalništvu nov pomen (Izwaini, Sattar: A corpus-based study of metaphor in information technology), in slikoviti metaforiki, ki je prav za računalništvo zelo značilna (SSKJ: metáfora -e ž (á) lit. besedna figura, za katero je značilno poimenovanje določenega pojava z izrazom, ki označuje v navadni rabi kak drug podoben pojav). V preteklosti so že mnogi avtorji ugotavljali, da metaforika v strokovnem jeziku odraža razvoj in "stanje duha" na določenem strokovnem ali znanstvenem področju in tako zaznamuje predvsem novejše panoge in dejavnosti. Analiza korpusa angleških besedil s področja informacijske tehnologije, ki obsega okrog 7 milijonov besed, kaže bogat nabor terminov, ki se sicer uporabljajo v splošnem jeziku v zvezi z živimi bitji, z delavnicami in pisarnami, gradbišči in delovišči, morjem in celo v vojaškem življenju. Tudi naša knjiga sodi v to zbirko metafor.

Avtorjeve ugotovitve na kratko povzemam v spodnji tabeli, pri tem pa sem zaradi večje ilustrativnosti ostal pri angleških izrazih, ker bi slovenjenje ponekod zabrisalo osnovni smisel.

 

      Živo bitje assistant, awake, bug, client, communicate, conflict, deamon, dialogue, freeze, generation, hibernation, host, language, memory, mouse, protocol, syntax, widow/orphan, proxy, sleep, spine, virus, web, wizard, worm
      Delavnica device, download, equipment, hardware, install, installation, load, template, utility, task, tool, workstation
      Pisarna archive, attachment, copy, desktop, directory, document, erase, file, folder, library, mail, page, trash, trash can, wastebasket, write
      Gradbišče, delovišče access, address, architecture, destination, firewall, gateway, harvest, home, location, mining, sign in/log in, sign out/log out, platform, port, portal, site, storage, visit, wallpaper, window, workstation
      Cesta access, block, bus, highway, map, path, shortcut, speed, superhighway, traffic, transport
      Knjiga bookmark, browse, browser, page, publish, read, write
      Morje flow, navigate, pirate, stream, surf
      Vojaški svet attack, combat, command, cracking, delete, disable, escape, instruction, password, save, security, target, war, warfare

četrtek, 13. december 2012

Bibliotekarstvo osvaja Termanio!

Prav te dni mineva eno leto, kar sem oznanil, da je Bibliotekarski terminološki slovar že javno dostopen na portalu Termania, danes pa z veseljem napoved razširjam in dopolnjujem – na slovarskem portalu Termania je odslej tudi Angleško-slovenski slovar bibliotekarske terminologije, ki ga je marsikdo med vami doslej gotovo že uporabljal bodisi tukaj na blogu Bibliotekarska terminologija ali na izvirni lokaciji, kjer ga je leta 2002 objavila Narodna in univerzitetna knjižnica. Ob vse večjem pojavljanju spletnih slovarjev na enotno organiziranih spletnih portalih in ob uporabi enotnega uporabniškega vmesnika smo se tudi pri tem slovarju odločili stopiti na pot tehnološkega poenotenja. Narodna in univerzitetna knjižnica je kot založnik dovolila prenos slovarja v novo okolje in spletno objavo vzporedne izdaje, Bibliotekarska terminološka komisija je dodala znanje, izkušnje in nekaj neprespanih noči, pri Amebisu pa so z dosedanjimi bogatimi izkušnjami izvedli konverzijo in namestitev v svoje okolje slovarskega portala Termania.

Na portalu Termania sta dva bibliotekarska terminološka slovarja.

Že obstoječa in leta 2002 na spletu prvič objavljena slovarska zbirka je bila načrtovana in strukturirana tako, da omogoča natančen in konsistenten izvoz podatkov v druge sisteme, Amebisova specializirana programska orodja in že razvita platforma prosto dostopnega portala Termania pa omogočata prav tak uvoz naših podatkov. Za računalniške sladokusce naj omenim, da je slovar začel nastajati pred dolgimi leti še na znameniti "Mavrici" ZX Spectrum in je uspešno prestal vse migracije na novejšo strojno in programsko opremo, vključno z obilico različic operacijskih sistemov.

Termania je prosto dostopen spletni slovarski portal, namenjen predvsem iskanju po slovarskih zbirkah, njegova prednost pred drugimi slovarskimi portali je predvsem v tem, da so na enem mestu preko enotnega vmesnika na voljo slovarji povsem različnih tipov in struktur, in to ne samo za uporabniško iskanje, temveč tudi z možnostjo urejanja in gradnje slovarjev za urednike. Na portalu je že dostopnih nekaj pomembnih slovarjev (npr. SSKJ, Slovenski pravopis, Presisov večjezični slovar ipd.), ki pa so predvsem splošni, zato je smiselno dodali tudi čim več terminoloških slovarjev, za katere je precej zanimanja predvsem strokovne javnosti. Mednje sodita tudi Bibliotekarski terminološki slovar in Angleško-slovenski slovar bibliotekarske terminologije, ki ju želimo ponuditi uporabnikom ob hkratnem dostopu do vseh ostalih zbirk. Na uspeh, da sta med temi prosto dostopnimi spletnimi slovarji tudi dva bibliotekarska slovarja, smo upravičeno ponosni.

Na portalu Termania je trenutno 26 slovarjev, zadnji je bil dodan decembra 2012 (predstavitev portala), že nekaj časa jih je mogoče uporabljati tudi na mobilnih napravah. Termania za Android je brezplačen odjemalec za dostop do novega Amebisovega spletnega slovarskega portala Termania, na katerem so prav tako brezplačni enojezični (npr. SSKJ, Slovenski pravopis, medicinski slovar ipd.) in večjezični slovarji (angleški slovar, nemški slovar ...).

         

Termania za Android, brezplačna aplikacija

Slovarje je mogoče za silo uporabljati tudi z vsakim povsem preprostim pametnim telefonom

sobota, 8. december 2012

Rudarjenje malo drugače


© Vlaki.Info
Obvladovanje ogromnih količin podatkov, s katerimi se je soočal, je za človeka vedno predstavljalo izziv, ki ga je dokaj uspešno reševal, čeprav včasih z zamudo. Zadnja desetletja so bila tako v duhu podatkovnih zbirk različnih vrst in tipov, poudarek pa je bil poleg organizacije in hranjenja podatkov predvsem na učinkovitem dostopu do njih, kar so reševale različne oblike iskanja in poizvedovanja (o terminološkem enačenju in/ali razlikovanju izrazov find/search oz. slovenskih ustreznikih iskati/poizvedovati kaj več kdaj drugič). Danes zaradi vse večjih potreb po učinkovitem dostopu do kakovostnih in povezanih podatkov in informacij tudi to več ne zadošča, pojavilo se je podatkovno rudarjenje. Definicij podatkovnega rudarjenja je mnogo in gledajo nanj z različnih uporabniških zornih kotov, vse pa imajo skupno osnovno pojmovanje.

Podatkovno rudarjenje je postopek avtomatiziranega raziskovanja, analize ter odkrivanja značilnih in pomembnih vzorcev, modelov in zakonitosti ter znanja iz ogromne količine podatkov, shranjenih v podatkovnih zbirkah, podatkovnih skladiščih in drugih informacijskih odlagališčih. Najbolj znane metode podatkovnega rudarjenja so statistične metode in metode z nevronskimi mrežami, ki izvirajo iz raziskav strojnega učenja na področju umetne inteligence. Samo skladiščenje podatkov, že znana poizvedovanja in obdelava podatkov, informacijski sistemi za podporo odločanju, vizualizacija podatkov ipd. ne sodijo v podatkovno rudarjenje.

Kot smo tega že vajeni, se je v začetku slovenščina oklenila angleškega izraza data mining, vendar so se mu kmalu pridružili tudi poizkusi slovenjenja kot so odkrivanje zakonitosti v podatkih, rudarjenje podatkov, rudarjenje po podatkih, podatkovno rudarjenje, izkopavanje podatkov, izkop podatkov, kopanje podatkov, kopanje po podatkih, iskanje podatkov, izkoriščanje podatkov, odkrivanje podatkov in še kaj. Kot kaže, sta se najbolj udomačila in razširila podatkovno rudarjenje (v korpusu GigaFida 79 pojavljanj, Nova beseda 24, Korpus bibliotekarstva 34) in rudarjenje podatkov (GigaFida 42 pojavljanj, Nova beseda 20, Korpus bibliotekarstva 0).

Islovar, terminološki slovar informatike, se je odločil za oba, vendar je dal prednost podatkovnemu rudarjenju, ki ima zato razlago, in podredil sopomenko rudarjenje podatkov, ki zato v slovarju ostaja brez razlage in ima samo kazalko na prvega. Glede na vrsto obravnavanih podatkov navaja slovar še nekaj sestavljenk in seveda vse sopomenke:

  • besedilno rudarjenje -ega -a s (ang. text mining) gl. rudarjenje besedil
  • izkopavanje podatkov -a -- s (ang. data mining, datamining) neustr., gl. podatkovno rudarjenje
  • odkrivanje zakonitosti v podatkih -a -- -- -- s (ang. data mining, datamining) gl. podatkovno rudarjenje
  • podatkovno rudarjenje -a -- s (ang. data mining) odkrivanje vzorcev v množici podatkov, ki navadno sloni na statističnih metodah ali metodah strojnega učenja; sin. odkrivanje zakonitosti v podatkih, rudarjenje podatkov
  • podatkovno rudarjenje besedil -ega -a -a s (ang. text mining, text data mining) podatkovno rudarjenje v veliki količini besedil; sin. rudarjenje besedil
  • podatkovno rudarjenje spleta -ega -a -- s (ang. web mining, web data mining) podatkovno rudarjenje po podatkih, dostopnih na spletu; sin. rudarjenje spleta,spletno rudarjenje
  • rudarjenje besedil -a -- s (ang. text mining) podatkovno rudarjenje v veliki količini besedil; sin. besedilno rudarjenje; prim. rudarjenje spleta
  • rudarjenje podatkov -ega -a s (ang. data mining) gl. podatkovno rudarjenje
  • rudarjenje spleta -a -- s (ang. web data mining, web mining) podatkovno rudarjenje po podatkih, objavljenih na spletu; sin. podatkovno rudarjenje spleta, spletno rudarjenje; prim. rudarjenje besedil
  • rudarjenje toka podatkov -a -- -- s (ang. stream data mining, data stream mining) podatkovno rudarjenje v podatkovnem toku
  • spletno rudarjenje -ega -a s (ang. web data mining, web mining) gl. podatkovno rudarjenje spleta in rudarjenje spleta