četrtek, 21. februar 2013

Mednarodni dan materinščine

Organizacija Združenih narodov za izobraževanje, znanost in kulturo - Unesco je razglasila 21. februar za Mednarodni dan maternega jezika in s tem opozorila na veliko jezikovno in kulturno raznolikost v svetu ter poudarila izjemen pomen spoštovanja do lastnega in tudi drugih jezikov. Letos ga praznujemo že štirinajstič. Zamisel je nastala kot spomin na protest in smrt bengalskih študentov, ki so leta 1952 v Pakistanu zahtevali enakopravnost za svoj jezik. Z mednarodnim dnevom maternega jezika skuša Unesco opozoriti na potrebo po ohranjanju kulturne in jezikovne raznolikosti posameznih področij po svetu. Jeziki so najmočnejše orodje za ohranjanje in razvoj oprijemljive in neoprijemljive, tj. materialne in nematerialne, kulturne dediščine. Zato bodo vsa prizadevanja za vzpodbujanje in širjenje maternega jezika krepila jezikovno raznolikost in možnosti izobraževanja v različnih jezikih, istočasno pa seveda razvijala v ljudeh zavedanje jezikovne in kulturne tradicije lastnega naroda in tudi drugih po vsem svetu, kar bo navdih za solidarnost, temelječo na razumevanju, toleranci in dialogu.

Tema letošnjega dneva materinščine je pisana na kožo knjižničarjem. S sloganom Knjige za izobraževanje v maternem jeziku želi Unesco ob dnevu materinščine podpreti produkcijo knjig za izobraževalne namene v maternem jeziku, saj knjige in učbeniki pripomorejo k bogatenju jezika in opismenjevanju v maternem jeziku. Natisnjena gradiva v materinščini so še vedno zelo pomemben temelj za učenje, je mogoče prebrati na Unescovi spletni strani. Danes je sicer pri mnogih jezikih še vedno mogoče opaziti pomanjkanje natisnjenih gradiv, čeprav je v zadnjem času zaznan tudi napredek. Računalniška tehnologija in relativno nizki stroški digitalnega tiska obetajo cenejše natisnjena gradiva, kar je povezano tudi z njihovo širšo dostopnostjo.

Po podatkih Statističnega urada Slovenije je na ozemlju Slovenije materni jezik velike večine prebivalstva slovenščina. Število prebivalcev, katerih materni jezik je slovenščina, sicer vztrajno narašča, vendar počasneje kot število vseh prebivalcev Slovenije. Delež prebivalstva, ki opredeljuje slovenščino kot svoj materni jezik, se tako v Sloveniji že od leta 1953 znižuje (leta 1953 je ob popisu prebivalstva slovenščino kot svoj materni jezik navedlo 96,8 odstotkov, leta 2002 pa 87,8 odstotkov). K sooblikovanju materinščine, ki ni slovenščina, v Sloveniji pripomoreta tudi obe uradno priznani narodni manjšini in s tem italijanščina ter madžarščina kot materinščini za številne Slovence. Z vprašanjem Zakaj ne po slovensko? se je te dni našega odnosa do materinščine kritično lotil tudi dr. Marko Stabej.

"V obdobju novih tehnologij ostajajo knjige neprecenljivo orodje, s katerim je lahko rokovati, ob tem pa je dovolj robustno in praktično za širjenje informacij, vzajemnega razumevanja in odprte poti v svet za vse. Knjige so stebri na znanju temelječih družb in so nepogrešljive za vzpodbujanje svobode izražanja in izobraževanja za vse."
Irina Bokova, Generalna direktorica Unesca ob Mednarodnem dnevu materinščine

Mednarodni dan materinščine ima tudi svoj profil na Facebooku.


Terminološka zbirka EU - materni jezik kot ga srečujemo v evropskih jezikih
Vir: EU Terminology database

ponedeljek, 18. februar 2013

Od iskanja do poizvedovanja in odkrivanja


© BLACKBAUDKNOWHOW
Čeprav so obstajale elektronske podatkovne zbirke že davno prej, so doživele pravi razcvet šele z večjimi možnostmi telekomunikacijskega dostopa do njih v osemdesetih letih in seveda z razmahom interneta v devetdesetih letih prejšnjega stoletja. V tem času je bilo poleg strukturiranja podatkov in čim izdatnejšega dopolnjevanja zbirk največ pozornosti in naporov posvečeno iskanju oz. poizvedovanju – kako omogočiti (relativno) enostavno pa vendarle učinkovito in predvsem tudi dovolj hitro poizvedovanje po vse kompleksnejših in že prav ogromnih zbirkah. Še predno je bil dosežen ta cilj (pridružujem se mnenju, da manjka modulom za poizvedovanje še mnogo marsičesa), se je pojavil nov izziv. Zaradi vse večjih informacijskih potreb uporabnikov in izjemno velikega števila relevantnih elektronskih virov želi povprečen uporabnik vse pogosteje opraviti isto poizvedbo na večjem številu virov, kar je zamudno in seveda obremenjujoče. Zato je šel naslednji korak v razvoj združevalnih iskalnikov (gl. npr. Pušnik, M., Vodeb, G.: Enotni uporabniški vmesniki in združevalni iskalniki . . . ), ki sprejmejo enkratno uporabnikovo zahtevo in nato izvedejo enako poizvedbo hkrati na večjem številu elektronskih virov, navadno podatkovnih zbirk, zbirk elektronskih časopisov, elektronskih člankov, elektronskih knjig, repozitorijev, knjižničnih katalogov ipd., rezultate vseh poizvedovanj združijo v en sam seznam in do neke mere odpravijo duplikate. Kadar je to mogoče, poseben povezovalnik napoti uporabnike tudi neposredno na celotno elektronsko besedilo dokumenta. Ker poizvedujejo povezovalni iskalniki po že pripravljenih metapodatkih v indeksih založnikov, agregatorjev, repozitorijev, katalogov ipd., govorimo o metaiskalnikih (npr. Metaiskalnik za slovensko kulturo, DiKUL, Metaiskalnik ipd.). Kot so pomenili združevalni iskalniki za uporabnika res velik korak naprej, pa se sedaj vedno bolj kaže, da ne zadoščajo in so preokorni, prepočasni in premalo prilagodljivi, predvsem pa je njihovo iskanje vse preveč "površinsko" in vezano na metapodatke, premalo pa na vsebino dokumentov. Pred nekaj leti so te pomanjkljivosti začela reševati nova orodja, ki se kitijo z novim zvenečim imenom discovery. Tudi knjižnice Univerze v Ljubljani bodo letos nadgradile storitve in funkcije metaiskalnika z namestitvijo servisa za odkrivanje informacij, zato prav te dni poteka testiranje in ocenjevanje štirih ponujenih rešitev (zanimivo, da se za tovrstna orodja uporabljata tudi termina solution in discovery solution), to so OCLC WorldCat Local, ProQuest/Serials Solutions Summon, EBSCO Discovery Service in Ex Libris Primo Central.

S temi orodji je prišla množica novih poimenovanj kot so discovery, discovery service, discovery tool, solution, discovery solution, e-discovery, electronic discovery, discovery expert in še kakšno. O uspešnosti njihovega slovenjenja pa v naslednji objavi, tukaj le nekaj z združevalnim iskanjem povezanih terminov:

search - iskanje, poizvedovanje
federated search - združevalno iskanje
federated search engine - združevalni iskalnik
resolver, link resolver - povezovalnik, hipertekstni povezovalnik
metasearch - metaiskanje
metasearch engine - metaiskalnik
deduplication - deduplikacija, odstranjevanje dvojnic

sobota, 9. februar 2013

Nenavadni števniki


Sobolj - Martes zibellina
© Мир Животных
Ko se otrok uči materni jezik, so številke eden prvih podsistemov, ki ga mora poznati in pri katerem ni kaj dosti možnosti za lastno "kreativnost", tudi pri učenju tujega jezika so kmalu na vrsti in navadno predstavljajo trši oreh. Menda je dokazano, da človek vse življenje, tudi če se do popolnosti nauči in živi z drugim jezikom, v naglici še vedno šteje v maternem jeziku. Ker je naše poznavanje jezikov precej omejeno predvsem na jezike sosedov in nekaj svetovnih jezikov, le redko kdo ve, da so števniki in številski sistemi jezikov zelo različni. Kdo bi si mislil, da obstaja mnogo jezikov, ki štetja (skoraj) ne poznajo oz. ga niso poznali do stika s kolonialnim svetom in jezikom kolonizatorja. Štetje "ena, dve, tri, mnogo . . . " zato ni samo krilatica, ampak tudi opis dejanskega stanja v mnogih jezikih. Tisti pa, ki štetje imajo, pogosto ne upoštevajo za osnovo nam tako znanega in nepogrešljivega desetiškega sistema, pač pa imajo nekateri za osnovo 2, 3, 4, 8, 12, 20 in še kaj drugega. Mnogi strokovnjaki to razlagajo s "pripomočki", ki so jih ljudje uporabljali za štetje (npr. 2 roki, 3 členki prsta, 4 vrzeli med prsti, 5 prstov ene roke, 10 prstov dveh rok ipd.), tudi etimologija števnika deset navaja kot možen vir poimenovanje "dve roki", torej deset prstov. Dvanajstiški sistem je v uporabi še danes tudi v t.i. "razvitem svetu" (12 palcev v čevlju, 12 unč v funtu), še ne dolgo tega so se tudi pri nas nekateri izdelki še prodajali po ducatu ali pol ducata.

Indoevropski jeziki imajo za osnovo jezikovnega sistema števnikov praviloma desetiški sistem, ki je navadno zelo podoben. Najprej štetje z osnovnimi števniki od nič do deset, potem sledijo kombinacije deset + osnovni števnik z značilno končnico (slo. –najst, ang. –teen, fra. –ize, ita. –dici, rus. –nadcat, nem. -zehn ipd.), ki je dala v nekaterih jezikih tudi ime mladi generaciji (teenagers, najstniki). Po dvajsetici se nadaljuje dodajanje osnovnih števnikov do naslednje desetice in tako naprej do sto. Je pa nekaj izjem, ki navadno grenijo življenje pri razumevanju in predvsem govorjenju tujega jezika.

V latinščini se tik pod dvajset zaplete in začne odštevanje od dvajset (dvajset minus dve, dvajset minus ena), podobno se lahko ponovi pred vsemi deseticami (38, 39, 48, 49 itd.), vendar je tam lahko v uporabi tudi bolj znana različica z osem in devet.

18 duodeviginti (dobesedno: dva do dvajset)
19 undeviginti (dobesedno: ena do dvajset)
Še bolj zapleteno in razgibano je v francoščini, čeprav je nastala pod zelo močnim vplivom latinščine. Od nič do šestdeset je štetje v glavnem po znanem kopitu, zaplete pa se po šestdesetici in po osemdesetici – v obeh primerih se dodaja številke od 1 do 19 po vzoru: 76 = 60 + 16, 99 = 80 + 19 ipd). Števniki postanejo dokaj dolge zloženke z vezaji in so čisto pravi matematični izrazi, zato je treba v začetku najprej preračunati in šele potem pogruntati besedo zanj! Da ni dolgčas, poskrbijo še dodatna poimenovanja za 70, 80 in 90 – poleg omenjenega "seštevka" se v nekaterih različicah francoskega jezika uporabljajo tudi zastarele oblike septante, octante, huitante, novante.
70 soixante-dix (dobesedno: šestdeset deset)
70 septante samo v Belgiji in Švici
78 soixante-dix-huit (dobesedno: šestdeset osemnajst)
80 quatre-vingts (dobesedno: štiri dvajsetice)
80 huitante samo v Švici in nekaterih dialektih
80 octante samo v Švici in nekaterih dialektih
90 quatre-vingt-dix (dobesedno: štiri dvajsetice deset)
90 nonante samo v Belgiji, Švici, Kongu in Rwandi
98 quatre-vingt-dix-huit (dobesedno: štiri dvajsetice osemnajst)
Slovanski jeziki imamo zelo podobno štetje, razlike nastajajo predvsem pri vrstnem redu sestavnih delov, to je enic in desetic (primerjaj srb. tridesetdva in slo. dvaintrideset), kjer smo Slovenci najbrž povzeli vrstni red po nemščini.
Ob nekaterih manjših posebnostih, ki si jih je treba zapomniti v ruščini, ima ta jezik tudi dve posebnosti, to sta 40 in 90. Štirideset (сорок) po svojem izvoru najbrž sploh ni pravi števnik, etimologi domnevajo, da je bilo zanj prevzeto poimenovanje šopa štiridesetih krzen soboljevine, ki je bilo v srednjem veku enota v trgovanju in zelo vredno plačilno sredstvo.
Ruski devetdeset (девяносто) je po nastanku malce meglen in naj kaže nekaj različnih domnev, verjetno pa je, da izhaja iz "devet delov od sto" (Vir: Макс Фасмер. Этимологический словарь русского языка in Словарь "Новое в русской этимологии").
40 сорок ime za šop soboljevine
90 девяносто devet delov od sto

Če menite, da je štetje v slovenščini enostavno, napišite z besedo števnike od nič do trideset, potem pa še nekaj letnic, npr. 1935, 1968, 15764. Ni težko,prsti pa včasih vendarle malo zastanejo!


Šop štiridesetih najdragocenejših soboljevih krzen je dal poimenovanje za ruski števnik 40

sobota, 2. februar 2013

Slovenščina na spletu


Spletne strani glede na jezik objave
© W3Techs
Slovenci smo znani po tem, da smo sposobni, z izjemo v politiki, kljub svoji maloštevilnosti skoraj na vseh področjih prekositi svoje mnogo številčnejše bližnje in daljne sosede. To vsak dan dokazujejo odmevni vrhunski rezultati na svetovni ravni v športu, znanosti, kulturi ipd. Čeprav je na vsakih 3.500 zemljanov samo po eden Slovenec, kažejo mnogi odlični rezultati bistveno boljše uvrstitve. V podatkovni zbirki Web of Knowledge je skoraj vsak tisoči zapis vezan na slovenske avtorje, po nekaterih podatkih (pogosto žal nisi primerljivi in segajo več let nazaj) je bila Slovenija leta 1999 po številu objavljenih naslovov knjig na 1000 prebivalcev celo na odličnem 7. mestu za Islandijo, Dansko, Švico, Finsko, Estonijo in Veliko Britanijo (vir: NationMaster).

Kako pa je s pojavljanjem Slovencev in slovenščine na spletu? Sredi leta 2012 naj bi bilo na svetu okrog 2,4 milijarde uporabnikov interneta, kar predstavlja 34,3% prebivalstva, to pa je desetkrat več kot konec leta 1999. Slovenija, ki je po prebivalstvu na 142. mestu (2.029.680 prebivalcev v letu 2011), je z 1.465.209 uporabniki interneta na 102. mestu (vir: fact fish). Enake podatke ugotavlja za Slovenijo raziskava RIS: V začetku leta 2011 je imelo dostop do interneta 72% slovenskih gospodinjstev, kar pomeni 69% oseb v starosti od 10 do 74 let.


Uporabniki interneta v Sloveniji - © fact fish

Med uporabniki interneta nedvomno prevladujejo tisti z angleško govorečih okolij, tesno za petami pa so jim že kitajsko govoreči uporabniki, ki bodo v kratkem zagotovo prevzeli vodstvo, in šele daleč za njimi Španci, Japonci, Portugalci in Nemci.


© STAR TS TRANSLATION SERVICES BLOG
Odlično pa se po nekaterih podatkih (tabela na levi strani) odreže slovenščina kot jezik objavljanja na internetu. Glede na delež slovenskih strani smo na odličnem 33. mestu! Pri tem je treba seveda upoštevati, da je metodologija zbiranja podatkov dokaj ohlapna in nenatančna, predvsem pa odvisna od metapodatkov, ki so navadno pomanjkljivi ali jih pogosto (žal) sploh ni. Tudi ob upoštevanju te tolerance nedvomno še vedno izjemna uvrstitev slovenskih spletnih strani.

V času, ko sem pisal ta prispevek in zbiral podatke zanj, je po podatkih Wordometers na svetu izšlo 853 naslovov novih knjig.


Internet v številkah