nedelja, 29. januar 2012

Book – vendar ni knjiga!


© Wikipedia
Z razvojem sodobne tehnologije se vsakodnevno rojevajo nova poimenovanja, pretežno nastajajo v angleškem jeziku in si potem utirajo pot še drugam, kjer doživijo eno od štirih usod: dobesedni prevod (ti. kalkiranje, npr. online – linijski, printer - tiskalnik), oblikovanje ustreznice oz. uporaba že obstoječega prevoda (npr. mouse – miška, hash - lojtra), inovativno oblikovanje novega izraza (npr. compact disc - zgoščenka) ali prevzem tujke, ki lahko postane izposojenka in se nato sčasoma celo povsem udomači (npr. radar, čip). Niso pa vsi izrazi novost, pogosto se zgodi, da jezik že uveljavljen, star izraz, "opremi" z dodatnim, novim pomenom. Ta prenos poimenovanja temelji navadno na podobnosti glede izgleda, materiala, funkcije. Tako so danes tudi grafitna pisala še vedno svinčnik (ki je bil poimenovan po paličici iz svinca), zobne zalivke po domače imenujemo plomba (tudi po svincu), vrsto črk imenujemo font (dobesedno: iz svinca ulita tiskarska črka), na zaslonu sta namizje in koš za smeti, stilizirana sličica je postala ikona in napravica na mizi miška, pa čeprav danes najpogosteje že brez repka. Za CC v elektronski pošti vemo, da pomeni pošiljanje sporočila v vednost še komu, prihaja pa iz besed "carbon copy" ali po slovensko kopija z indigo papirjem, ker smo včasih le tako lahko na pisalnem stroju izdelali verno kopijo dopisa.

Od preprostih predmetov, s katerimi živimo, je imela knjiga izjemno veliko in pomembno vlogo pri poimenovanju sodobnih elektronskih naprav. Kdo ve, zakaj. Do neke mere nedvomno zaradi svoje značilne oblike ter enostavne in lahke prenosljivosti (predmeta in vsebine, to je podatkov), zagotovo pa tudi kot aluzija na znanje, izobraženost, kulturo, nepogrešljivost . . . V nadaljevanju navajam nekaj primerov v angleškem jeziku, ki pa v slovenščini niso našli analogije.

  • notebook - tudi laptop, je najstarejši in tudi edini, ki je dobil slovenski ustreznik notesnik (in sopomenko prenosnik, ker je bil prvi te vrste, sedaj pa so prenosni seveda tudi vsi njegovi nasledniki, zato glej primerjavo med notebookom in laptopom v zaključku!)
  • smartbook je prenosna naprava, ki združuje lastnosti pametnega telefona in mrežnika (ali spletnega računalnika, mini prenosnika), na tržišče je prišel leta 2009
  • subnotebook (tudi ultraportable, mini notebook) je vrsta prenosnih računalnikov, ki so manjši in lažji od navadnega notesnika
  • mini notebook tudi subnotebook, ultraportable
  • netbook ali mrežnik, spletni računalnik, mini prenosnik je majhen, lahek in energetsko varčen prenosnik, posebno primeren za komuniciranje in internetni dostop
  • ultrabook je dodelana in izboljšana različica subnotebooka in se je pojavil kot blagovna znamka Intela.
Ob teh generičnih poimenovanjih podzvrsti prenosnih računalnikov obstajajo še številna imena izdelkov različnih proizvajalcev, ki koketirajo z besedo book, npr. Flybook, Toughbook, Macbook, iBook, PowerBook, EliteBook, Chromebook, Dynabook, Lifebook, Smartbook, OmniBook, TouchBook in še kaj. Pogosto skuša ime na šaljiv način ponazarjati katero od značilnosti (npr. Flybook - majhen kot muha, Toughbook – robusten, odporen, vzdržljiv ipd.). Glede na razširjenost in donosnost posla ni nenavadno, da potekajo celo zaradi imen izdelkov tudi težke (ob)tožbe.

Kako je z razmerjem med terminoma laptop in notebook?
Večinoma uporabljamo oba izraza brez razlikovanja kot sopomenki, to priznavata tudi Wikipedia in Islovar. Tudi proizvajalci in prodajalci se ne strinjajo glede tega, ali med njima obstajajo razlika ali ne, tako je mogoče celo v oglasih za isti izdelek zaslediti enkrat eno in drugič drugo poimenovanje. To potrdi tudi iskanje z Googlom, ker najdemo pri iskanju z enim ali drugim poimenovanjem pogosto isti izdelek. Nekateri strokovnjaki skušajo narediti nekaj reda z razlikovanjem takole (vir: Wiki Uncle):

  • Laptop je prenosni računalnik, namenjen resnemu delu, z močno konfiguracijo in velikimi pomnilniškimi kapacitetami. Notebook je namenjen enostavnejšemu delu in temu primerno je konfiguracija šibkejša.
  • Notebook je praviloma manjši in precej lažji od navadnega laptopa, ustrezno manjši je tudi zaslon.
  • Notebook nima vgrajene laserske enote (CD, DVD).
  • Laptop ima kvalitetnejše avdiokomponente, isto velja za grafiko.
  • Laptopova tipkovnica je večja in zato je tipkanje lažje in natančnejše.
  • Avtonomija baterije je pri notebooku dvakra večja ali še boljša.
  • Nadgradnja strojne opreme laptopa je lažja in enostavnejša kot pri notebooku.

ultrabook cartoon
© geek&poke

nedelja, 22. januar 2012

Najbolj uporabljane, vendar nič ne povedo!

Za zabavo pa še 100 najpogostejših besed v angleškem jeziku. Vsi jih poznamo, vsi jih uporabljamo, v vsakem stavku mrgolijo, pa vendar . . . samo s temi besedami ne bi preživeli dneva! Začetek seznama najpogostejših besed v vseh jezikih zapolnjujejo funkcijske besede, to so besede, ki navadno nimajo posebnega leksikalnega pomena in služijo za izražanje slovničnih odnosov z drugimi besedami znotraj stavka (za razliko od leksikalnih besed, med katere spadajo samostalniki, glagoli, pridevniki in večina prislovov, ki so v jeziku praviloma nosilci sporočila). Med funkcijske besede štejemo predvsem veznike, predloge, zaimke, pomožne glagole, člene in členke. Oglejte si zanimiv, na koncu pa že malce dolgočasen posnetek o stotniji najpogostejših, ki jih ponavljamo iz stavka v stavek, iz misli v misel . . . včasih tudi kot mašilo, ko nam zmanjka pravih besed.

torek, 17. januar 2012

Top 200

Zadnja objava Najpogostejše besede in besedne zveze v bibliotekarski literaturi je vzbudila radovednost, katere so še druge pogoste besede in kako so glede pogostosti razporejene. Kot že rečeno, so med prvimi dvajsetimi najpogostejšimi predvsem funkcijske besede in le tri leksikalne besede. Ker zajema Korpus bibliotekarstva iz strokovnih in znanstvenih besedil, je število leksikalnih besed, kamor sodijo tudi strokovni termini, med pogostejšimi besedami večje, kot bi bilo v splošnem (nestrokovnem) jeziku. Sledi preglednica najpogostejših 200 besed, očitno je zelo strmo upadanje pogostosti, bibliotekar je šele na 217. mestu in je še zadnja beseda s pogostostjo nad tisoč.

Zap.št.FrekvencaBeseda
161859in
252542v
329354za
422229ki
521541knjižnica
614632tudi
714288z
813374pa
913325s
1012169ta
1110805kot
1210682pri
139973o
149151ali
158044po
167727ne
177353biti
186312gradivo
196176informacijski
206158od
215893iz
225743do
235709ter
245687med
255530podatek
265445uporabnik
275257sistem
285152imeti
295103knjižničen
304968področje
314831informacija
324743še
334512knjiga
344452svoj
354311kateri
363788različen
373718ves
383659le
393629število
403606kar
413573vir
423485uporaba
433480njihov
443269visokošolski
453257leto
463220že
473171zbirka
482983potreba
492967nov
502868glede
512834skupina
522816znanstven
532809avtor
542787strokoven
552754storitev
562736znanje
572734rezultat
582727program
592686oblika
602677slovenski
612645če
622632analiza
632629revija
642592ona
652575velik
662568raziskovalen
672544razvoj
682542zato
692522študent
702515ko
Zap.št.FrekvencaBeseda
712496način
722473uporabljati
732455oziroma
742413vprašanje
752366primer
762365vsebina
772356dejavnost
782342univerza
792338bolj
802335naj
812332članek
822327prvi
832326splošen
842309iskanje
852292k
862292knjižničar
872283stran
882261posamezen
892260organizacija
902246pomemben
912204čas
922202dokument
932195študij
942166izobraževanje
952162zapis
962150en
972106zelo
982087digitalen
992062raziskava
1002018elektronski
1012018predvsem
1022006ob
1031998proces
1041964standard
1051914morati
1061908zaradi
1071882nekateri
1081838določen
1091834vendar
1101833znanost
1111828katalog
1121824publikacija
1131814okolje
1141809njegov
1151803kakovost
1161765bibliografski
1171762dostop
1181757delovanje
1191740možnost
1201736tisti
1211733vsak
1221701omogočati
1231679mesto
1241674vrsta
1251653naloga
1261631jaz
1271631zaposlen
1281627ker
1291615cilj
1301607naslov
1311599metoda
1321598sicer
1331585kjer
1341575pomoč
1351550projekt
1361548objava
1371539enota
1381539nekaj
1391515poseben
1401485baza
Zap.št.FrekvencaBeseda
1411485tehnologija
1421457njen
1431439šolski
1441434predstavljati
1451429prostor
1461405deloven
1471393nacionalen
1481387sam
1491378visok
1501359država
1511345prav
1521338model
1531338ocena
1541318študijski
1551311pogosto
1561310iti
1571303kazati
1581299problem
1591295stopnja
1601292javen
1611283univerziteten
1621271literatura
1631271osnova
1641262osnoven
1651261ustrezen
1661241obdobje
1671193torej
1681189sredstvo
1691189ugotoviti
1701188pismenost
1711184svet
1721180bibliografija
1731179pomen
1741178mednaroden
1751178podatkoven
1761175poleg
1771175šola
1781173namen
1791171delavec
1801171povezan
1811162vmesnik
1821160raziskovalec
1831154oddelek
1841143razlika
1851142naslednji
1861131fakulteta
1871130povezava
1881127element
1891127učenje
1901120sprememba
1911117kaj
1921112odgovor
1931109okvir
1941109pogoj
1951105manj
1961102večina
1971100vedno
1981093sodelovanje
1991089jezik
2001086vrednost
2011072značilnost
2021055bibliotekarstvo
2031053založba
2041051uporabniški
2051046vloga
2061043oprema
2071040uspešnost
2081039posameznik
2091036pred
2101022družba

nedelja, 15. januar 2012

Najpogostejše besede in besedne zveze v bibliotekarski literaturi


Pogostost
V sestavku Najpogostejše besede je bilo govora o pogostosti besed v splošnem jeziku, predvsem v slovenščini in v angleščini, nekaj primerov pa je bilo tudi iz nemščine, francoščine in srbščine/hrvaščine. Poglejmo tokrat specialni strokovni jezik in pogostost pojavljanja besed v slovenskih bibliotekarskih besedilih. Za analizo bodo služili podatki slovenskega Korpusa bibliotekarstva, ki obsega okrog 1,8 milijona besed iz 234 slovenskih bibliotekarskih strokovnih in znanstvenih besedil. Z avtomatsko lematizacijo (lematizacija je proces pripisovanja osnovne oblike besednim oblikam v besedilu, npr. vse glagolske oblike spremenimo v nedoločnik, vse samostalniške oblike v imenovalnik ednine ipd.), za katero obstaja tudi v slovenskem jeziku že nekaj prav uporabnih spletnih programov, se je zmanjšalo število različnih besed na samo nekaj več kot 20.300. Njihova pogostost je zelo različna, od 61.859 (veznik in) do ena, teh je največ (okrog 7.300 besed, ki jim pravimo enkratnice). Glede na to, da gre za strokovna in znansvena besedila, je razporeditev pogostosti drugačna, kot je to v splošnem jeziku. Beseda knjižnica je po pogostosti že na petem mestu (21.541), gradivo na osemnajstem (6.312) in takoj za njim pridevnik informacijski, kmalu sledijo še podatek, uporabnik, sistem, knjižničen, informacija, triintrideseta najpogostejša beseda je knjiga (4.512).

Orodje za gradnjo in uporabo korpusa omogoča tudi iskanje, prikaz in analizo n-gramov (n-gram je zaporedje določenega števila (n) besed, npr. besedni dvojček, trojček, četverček ipd.). V nadaljevanju so naštete nekatere najpogostejše besedne zveze glede na pojavljanje v besedilih, ki jih analizira Korpus bibliotekarstva. Upoštevane so tiste besedne zveze, ki jih lahko štejemo za stalne besedne zveze ali za strokovne termine (ne pa npr. samostalnik s predlogom ali veznikom, osebek z glagolom ipd.), naštevanje začne z najpogostejšimi in sega v vsaki skupini po rangu do stotega mesta.

Besedni pari
   knjižnično gradivo
   visokošolske knjižnice
   informacijska pismenost
   informacijski viri
   splošne knjižnice
Besedni trojčki
   Univerza v Ljubljani
   v elektronski obliki
   sistemi za poizvedovanje
   enota knjižničnega gradiva
   v digitalni obliki
Besedni četverčki
   uporabniki s posebnimi potrebami
   Narodna in univerzitetna knjižnica
   dejavnost kot javna služba
   trajno ohranjanje digitalnih virov
   Center za razvoj knjižnic
   predmet informatika v športu
   informacijska in komunikacijska tehnologija
   standardi za splošne knjižnice
   nacionalni program za kulturo
    za otroke in mladino
   strokovni kriteriji in merila
   merila za visokošolske knjižnice

Besedni peterčki
   bibliotekarstvo, informacijska znanost in
       knjigarstvo
   knjižnična dejavnost kot javna služba
   pogoji za izvajanje knjižnične dejavnosti
   delo v sistemu vzajemne katalogizacije
   knjižnično gradivo na 1000 prebivalcev
   programska oprema za avtomatizacijo knjižnic
   zagotavljanje dostopa do informacijskih virov
   dostop do elektronskih informacijskih virov
   gradivo in drugi informacijski viri

 

Podatke o pogostosti posameznih besed in besednih zvez je treba razumeti v kontekstu besedil, ki jih Korpus bibliotekarstva zajel in analiziral (glej Korpus bibliotekarstva je dosegel popolno funkcionalnost). Od tega, katera besedila (in katerih avtorjev oz. s katerih strokovnih področij) so upoštevana, so odvisni besedni zaklad, pogostost posameznih besed in besednih zvez.

Zanimiva je infografika s prikazom 86.600 najpogostejših besed angleškega jezika, zajetih v British National Corpus, ki jo predstavlja WordCount.
Nekaj zanimivosti s tega seznama – dvajset izbranih besed z oznako ranga na lestvici pogostosti:

rangbesedarangbeseda
219 information1577 TV
357 book3700 catalogue
406 read3780 journal
555 paper3928 PC
559 type4505 mouse
705 computer4875 mobile
843 technology8143 ink
930 write8222 librarian
1271 phone9397 tag
1552 library11013 wireless


WordCount - Primer prikaza ranga za besedo database, ki je
v rangiranem seznamu na 2876. mestu tik pred besedo socialist