ponedeljek, 19. marec 2012

Koliko je besed?


Vsak dan srečam kakšno novo
in nikoli ne bom spoznal vseh.
© SpanishTranslation.US
Zadnjič je bilo govora o besednem zakladu posameznika in številu besed, ki jih potrebujemo za vsakodnevno komuniciranje. Koliko besed pa imajo posamezni jeziki? Angleščina, slovenščina, nemščina . . . Jezikoslovci so mnenja, da je nemogoče prešteti vse besede kakega jezika, ker se jezik nenehno spreminja in predvsem zato, ker je nemogoče opredeliti, kaj bomo šteli kot "besedo", v kolikšni meri bomo šteli tudi tujke in izposojenke ter akronime, kako bi šteli pojme, ki jih označuje večbesedna besedna zveza (za pisalni stroj potrebujemo Slovenci dve besedi, Nemci so ti dve besedi zlili v eno (Schreibmaschine), Francozi potrebujejo tri (machine à écrire), v angleščini pa zopet zadošča enobesedno poimenovanje (typewriter) ipd. Jasno pa je, da so razlike v obsegu besednega zaklada med jeziki zelo velike tudi zaradi načina, kako jezik funkcionira v odnosu do svojega okolja in drugih jezikov. Za angleščino je značilno, da z lahkoto sprejema besede od drugod in jih spretno "požira" in asimilira, nekateri jeziki pa se močno ograjujejo, taka je na primer francoščina, ki je znala praviloma tudi na področju najnovejših tehnologij skovati ustrezne domače izraze (npr. livre numérique za elektronsko knjigo). Nemščina spretno zlaga besede v dolge nove nize (klasičen šaljiv primer je Hotentotenpotentatentantenatentäter, ki je sestavljen iz štirih samostojnih besed in pomeni nekaj takega kot »atentator na teto poglavarja Hotentotov«), ugrofinski jeziki so v tem še plodovitejši, slovenščina pa se takemu besedotvorju izogiba (vendar: detomor, knjigoljub, avtocesta, sredobežnica, rokonaslon, knjigožer ipd.).

Ko govorimo o številu besed kakega jezika, imamo v mislih besedišče, ki omogoča komuniciranje večine govorcev tega jezika kot maternega jezika, vključno s pogostejšimi in bolj splošno razumljivimi izrazi iz tehnike, znanosti, umetnosti ipd. Tak splošen besednjak večine jezikov v industrijsko razvitem svetu šteje okrog 200.000 besed. Germanski jeziki obsegajo praviloma več besed, kot romanski, razlog za to je zgoraj omenjeno sestavljanje besed, ki "proizvaja" vedno nove sestavljene besede, te pa bogatijo slovar. Jezikoslovci ocenjujejo, da obsega nemški besednjak okrog 400.000 besed, švedski pa okrog 300.000. Angleški jezik vsebuje poleg izvorno germanskih tudi mnogo latinskih besed, ki so prišle neposredno iz latinščine ali posredno preko romanskih jezikov, predvsem francoščine. Tipičen primer parov besed germanskega/romanskega izvora so poimenovanja živali in iz njih nastalih živil (npr. pig – pork, sheep – mutton, calf - veal ipd.). Po taki metodi ocenjen obseg angleškega besednjaka presega pol milijona besed. Najbolj znana in po vsem svetu razširjena angleška beseda je gotovo O.K.

K temu pa je treba prišteti še besedišče znanosti in tehnologije ter posameznih strok, ki ga dovolj pogosto uporablja večje (čeprav omejeno) število ljudi. Večinoma gre za ti. mednarodne besede, torej tujke, ki so v različnih jezikih najpogosteje enake ali vsaj zelo podobne (npr. international – internazionale - internacionalen). Tovrstnih besed je presenetljivo dosti, dosegajo kar pol milijona. Ena novejših v slovenščini je npr. cunami, nekaj pred tem sta postala moderna tajkun (pa tudi izpeljanke, npr. tajkunizacija in še 22 drugih) in milenijski. Če tovrstne besede prištejemo splošnemu besednjaku, dobimo ti. skupen slovar jezika, ki ga strokovnjaki ocenjujejo za angleščino na 700 do 800 tisoč leksemov (leksem je najmanjša enota v pomenskem sistemu nekega jezika, npr. beseda, krajšava ali besedna zveza). Neverjetno bogati so bili že nekateri starodavni jeziki, izpričani v ohranjenih zapisih. Latinščina, stara grščina in stara islandščina so poznale okrog sto tisoč besed, sanskrt pa celo dvakrat toliko! (Vir: How Many Words Are There In The Language And How Many Of Them Must Be Learnt?)


© Milenijski razvojni cilji
Za razvoj znanosti, medicine, tehnologije in mlajših strok, zlasti pa v publicistiki, je značilna tvorba neologizmov, ki prav tako pomembno vplivajo na rast besednjaka. Neologizem ali besedna novota je beseda ali besedna zveza, ki v jeziku še ni splošno uveljavljena. Navadno nastajajo kot nove enote v jeziku s prevzemanjem ali s ponovno oživitvijo besed, ki so v jeziku že obstajale. Poleg znanosti so vir neologizmov pogosto apokaliptični dogodki (npr. Katrina, topljenje sredice (reaktorja), cunami, 9/11, klimatske spremembe, finančni cunami), družbena omrežja (npr. všečkati, lajkati), svetovni dogodki (npr. uzulele) pa tudi bolj ali manj posrečene javne osebnosti (npr. bušizmi). Slovenski pravopis 2001 zapisuje na primer kot besedno novoto besedo potresnik (potresni oškodovanec), podvrsta računalniških navdušencev bo poznala pridevnik igričarski. Ob letošnjem 8. marcu me je našla nepripravljenega nova beseda v stavku "Združeni narodi so ustanovili novo telo za opolnomočenje žensk . . . ". O opolnomočenju otrok so pred tem govorili že šolniki. Nisem prepričan, da besedo in v njej skrit pomen povsem razumem. Pač nisem dovolj opolnomočen . . .

Prav tako ne gre zanemariti doprinosa številnih besed slenga in nasilnega oglaševanja (npr. minglaj z nami . . ., Julči je zih'r ena huda bejba ipd.; oba primera sta iz radijskega oz. televizijskega oglaševanja). Današnji sleng se navadno močno opira na tuje jezike, v tem seveda prednjači angleščina (fak men, grem s frendi na drink), pogosto pa tudi jezike manjšin ali priseljencev, pri nas sta to predvsem srbščina in hrvaščina, ki sta nam dali tudi največji del "močnih" besed in kletvic, nemalo pa tudi besed v kulinariki. V angleškem slengu so seveda drugi vplivi, npr. španski, italijanski, tudi kitajski, indijski, hebrejski idr. Zanimivost: ameriški pisatelj Anthony Burgess je v svojem bestselerju Peklenska pomaranča skoval sleng svojih ameriških razgrajačev iz ruščine (npr. droog – tovariš, nadsat – najstnik, bezoomny – nor, bolshy – velik, otchkies – očala, zoobies – zobje, zvook – zvok ipd.). Obstajajo obsežni slovarji slenga v različnih jezikih, nekaj podobnega je tudi slovenski Razvezani jezik (PDF ali HTML).

Po nekaterih podatkih pridobi angleščina vsak dan okrog 14 novih besed, nekatere se pojavijo in izginejo, druge se udomačijo in obdržijo. Le te slednje prej ko slej najdejo svoje mesto tudi v slovarjih. The Oxford English Dictionary (2nd edition - OED2) vsebuje okrog 600 tisoč razlag in sledi dokaj ohlapnim kriterijem izbora. Poleg standardnega jezika literature in pogovornega jezika vključuje tudi zastarele izraze, najpogostejšo tehniško in drugo strokovno terminologijo in v dokajšnji meri tudi sleng in dialekte. Webster's Third New International Dictionary ima nekaj manj kot 500 tisoč iztočnic, po besedah urednikov pa naj bi bil letni "priliv" novih besed v angleščino kar okrog 25 tisoč!

Po podatkih inštituta The Global Language Monitor naj bi angleščina v sredo, 10. junija 2009, ob 5.22 zjutraj (sic!!!) prešla magično mejo enega milijona besed. In katera je bila milijonta beseda? Seveda to ni moglo biti nič drugega kot Web 2.0 (in tik pred tem tudi cloud computing)! Med jezikoslovci in slovaropisci je izjava seveda naletela na pomisleke in nasprotovanja, vendar je bila številka v mnogih objavah in poročilih takoj nekritično sprejeta, do neke mere pa so jo vendarle potrdile tudi nekatere druge podobne raziskave. Googlova raziskava v sodelovanju s Harvardom je konec decembra 2010 z analizo 5,2 milijona digitaliziranih knjig ocenila fond angleškega jezika na 1.022.000 besed z letnim prirastom okrog 8.500 novosti. Seveda bo mnenj toliko, kot je v razpravo vključenih jezikoslovcev! Že definicija besede je vprašljiva in vsak bo štel po svoje. Vprašanje je namreč, katere besede upoštevati. Ali šteje vsaka spregatev in sklanjatev, ali je treba upoštevati tudi narečne ali slengovske oblike, pa besede, ki jih nihče več ne uporablja in jih je povozil čas, ali pa neologizme, ki umrejo skoraj isti hip, kot jih nekdo javno izgovori? Zame "Web 2.0" pač ni beseda. Koliko besed je hot dog, hot-dog in hotdog? Kaj je (še) angleščina in kaj več ni? Na kateri strani bodo latinski izrazi iz medicine, prava, pa francoska gastronomija, japonske borilne veščine in azijske meditacije? Ob tem ne gre pozabiti, da je okrog deset odstotkov (po nekaterih sodbah v velikih slovarjih celo do 20 odstotkov) zastarelih besed, ki niso več v tekoči rabi ali so že skoraj pozabljene. Res pa je, da prihajajo nove besede hitreje, kot stare odmirajo. Iz povedanega lahko zaključimo, da je "število besed" nekega jezika odvisno predvsem od kriterijev - "pravih" besed in takih, ki so v kolikor toliko splošni rabi, je mnogo manj, kot bi nekateri želeli prikazati. Po Billu Brysonu (knjiga The Mother Tongue) naj bi imela angleščina v širši rabi kakih 200.000 besed, nemščina 184.000 in francoščina 100.000.

Kaj pa slovenščina? Slovenski srednješolci uporabljajo v povprečju deset tisoč besed, za branje slovenskih časopisov zadostuje že znanje pet tisoč besed, tujec pa bi se za silo znašel z znanjem dva tisoč slovenskih besed, pravijo raziskovalci. "Slovenščina se s 400 do 500 tisoč besedami dobro drži," je prepričan dr. Primož Jakopin, vodja Laboratorija za korpus slovenskega jezika pri ZRC SAZU (Slovenskih 500 tisoč, Finance, 31.12.2008). Kot pojasnjuje Jakopin, gre za besede splošne slovenščine, ki jih najdemo v Slovarju slovenskega knjižnega jezika (93.500 gesel), v Besedišču slovenskega jezika (178 tisoč gesel, ki jih niso uvrstili v slovar), ter druge besede, ki so se v minulih dveh desetletjih pojavile v periodičnem tisku in knjigah, na televiziji, v diplomskih in magistrskih nalogah ter doktorskih disertacijah, pa še v drugih publikacijah, na primer letakih in reklamah, ter na internetu. Še vedno manjka ogromno predvsem strokovnega besedišča. Mnogo besed je potem še v pogovornem jeziku, ki je v slovarjih bolj slabo zajet. V uporabi je torej okoli pol milijona besed, seveda govorimo le o osnovnih besedah, če bi želeli dobiti še vse sklanjane/spregane/stopnjevane oblike, je treba to še pomnožiti. V praksi pa je tako, da najpogostejših 1000 besed predstavlja več kot 50 % v slovenščini uporabljenih besed. Velika večina besed se pojavlja precej redko, večkrat tudi v kar precej omejeni skupini ljudi.

Glede na svojo "vitalnost" in število govorcev slovenščina nikakor ne sodi v kategorijo ogroženih jezikov. Angleščina je edini jezik prve kategorije, slovenščina pa je v drugi kategoriji, kjer so tudi jeziki z veliko večjim številom govorcev, na primer nemščina in francoščina ter ruščina. Prva kategorija pomeni, da jezik s svojim besediščem "pokriva" terminologijo prav vseh strok. Slovenščina je v drugo kategorijo napredovala po osamosvojitvi države in vstopu v Združene narode, z leti se je razširila s posvojitvijo (npr. schengen preide v šengen) in kovanjem novih strokovnih besed (npr. popkovnična kri). Med bolj prijetnimi novimi skovankami sta na primer biosolata in ekočevlji.

Čez čas pa še kaj o besedah v slovenskih bibliotekarskih besedilih.

2 komentarja:

Opomba: Komentarje lahko objavljajo le člani tega spletnega dnevnika.