Ko pa vzamem v roke Bibliotekarski terminološki slovar, je seveda drugače, saj sva skupaj rasla. Ko smo kakšno geslo v delovni skupini zadovoljivo obdelali, sem bil jaz tista "tipkarica", vsak znak v njem je posledica pritiska mojega prsta na tipko, najprej Spectrumovo, pa Atarijevo in pecejevo, začelo se je z 286, če komu od mlajših bralcev ta zgodovinska številka še kaj pove, potem pa na novejših vse do prenosnega hapeja, s katerim je šlo potem v tisk in tudi na splet. Z malo sreče naj bi spletna verzija do poletja prešla v drugo okolje, ampak ministrstvo spet zamuja z rezultati razpisa . . .
Tokrat bom nanizal nekaj statističnih zanimivosti o obsegu, sestavi in strukturi Bibliotekarskega terminološkega slovarja. Če zanemarimo 40 grafičnih znakov (npr. #, [, ©, * ipd.), je obsegala podatkovna zbirka v času izida tiskane izdaje slovarja 6520 zapisov, torej prav toliko gesel oz. terminov in terminoloških zvez, dokaj razčlenjena podatkovna struktura zbirke pa je odraz različnih potreb, ki jih mora slovar izpolniti.
Pregled terminološke slovarske zbirke ponuja nekaj zanimivih osnovnih ugotovitev o zastopanosti besednih vrst:
- 5.767 gesel (86%) ima označevalnik za spol, so torej samostalniki ali samostalniške zveze, od tega 2.486 moškega spola, 2.483 ženskega spola in 798 srednjega spola
- glagolov je le 71, pri teh je označen tudi glagolski vid (24 dovršnih, 16 nedovršnih ter 31 dovršno in nedovršno)
- 184 je kratic in 164 okrajšav
- besednovrstno oznako ima 71 gesel, praviloma so to pridevniki - 68, po eden pa je predlog, prislov in veznik.
Skokovito upadanje pogostosti besed
Pri tovrstnih jezikovnih podatkih marsikdo pomisli na predpostavko Zipfovega zakona in se vpraša, ali velja tudi za ugotovitve v Bibliotekarskem terminološkem slovarju.
besed v slovarskih geslih |
Zipfov zakon temelji na trditvi, da je majhno število besed uporabljeno zelo pogosto, mnogo drugih ali skoraj vse ostale pa zelo poredko. V svoji prvotni obliki označuje empirično ugotovitev harvardskega jezikoslovca Georga Kingsleya Zipfa, da je v vsakem naravnem jeziku pogostost n-te najpogosteje uporabljane besede približno recipročno odvisna od n. Klasičen zgled Zipfove funkcije je funkcija 1/f. Če množico po Zipfovem zakonu porazdeljenih pogostosti uredimo od najpogostejše do najmanj pogoste, bo pogostost druge najpogostejše ravno ena polovica pogostosti prve, pogostost tretje najpogostejše pa 1/3 pogostosti prve itn., tako da je pogostost n-te najpogostejše 1/n pogostosti prve (Wikipedia, Zipfov zakon) |
Zipfov zakon velja predvsem za živi jezik, slovarsko gradivo pa seveda od tega odstopa, še toliko bolj, ker gre za terminološki slovar, kjer nekateri poudarki strokovne terminologije pa tudi razmišljanja uredniške skupine obidejo značilnosti in zakonitosti živega jezika za vsakodnevno komuniciranje. To ponazarja odstopanje teoretične in empirične krivulje na zgornjem grafu, vendar je očitno, da se trenda krivulj ujemata.
In kakšna je lestvica stotih najpogostejših besed, med katerimi je 72 samostalnikov in 28 pridevnikov? Vodi seveda knjižnica, pomenljivo pa je informacijski že na devetem mestu z več kot sto pojavljanji, takoj za petami pa sta mu podatek in informacija. Zelo visoko sta uvrščena tudi računalniški in elektronski.
Sto najpogostejših besed v geslih Bibliotekarskega terminološkega slovarja v razpredelnici in vizualiziranih v oblaku.
Ni komentarjev:
Objavite komentar
Opomba: Komentarje lahko objavljajo le člani tega spletnega dnevnika.