ponedeljek, 29. julij 2013

Mednarodna znanstvena konferenca CORPORA2013


© International scientific conference  
"Corpus linguistics"
Korpusno jezikoslovje je sodobna veja jezikoslovja, ki raziskuje značilnosti in zakonitosti naravnega jezika na podlagi obsežnega empiričnega vzorca besedil iz vsakdanje javne jezikovne rabe. V jezikoslovju je korpus oziroma besedilni korpus velika in strukturirana zbirka besedil, navadno grajena, hranjena in obdelana računalniško. Korpuse se uporablja za statistične analize pisanega in/ali govorjenega jezika, za preverjanje pojavitev besed in besednih zvez ali pa za potrditev lingvističnih pravil v določenem jeziku. So tudi nepogrešljivo in nadvse koristno orodje ob pripravi splošnih in tudi terminoloških slovarjev. Korpuse so že v predračunalniškem času izdelovali tudi ročno, taki so bili seveda prava redkost in skoraj čudež, danes pa so to praviloma računalniške zbirke podatkov shranjene na digitalnih medijih in nekatere tudi javno dostopne na spletu. Prvi digitalizirani besedilni korpus (Brown Corpus) vsebuje besedila v ameriški angleščini in je nastal že v šestdesetih letih preteklega stoletja. Korpusi druge generacije so povezani z razvojem tehnologije, ki omogoča njihovo delovanje in uporabo, in so nastali v sodelovanju raziskovalnih, univerzitetnih in pogosto tudi založniških okolij. Prosto dostopna reprezentativna referenčna jezikovna korpusa za slovenski jezik sta Nova beseda in Gigafida, nekaj pa je tudi za posebna strokovna področja specializiranih korpusov, vendar vsi niso javni ali pa za njih pogosto ne vemo (npr. dvojezični Evrokorpus - vzporedni korpus prevodov ali pa Vayna s četrt milijona besed iz 360 časopisnih člankov, ki so v času od aprila do avgusta 1998 obravnavali ti. "verbalne napade na JLA" (malo manj mladi se še spominjamo procesa JBTZ). O vseh naštetih sem na tem mestu pred časom že nekajkrat pisal. Dokaj bogat specializiran besedilni korpus imamo Slovenci tudi za področje bibliotekarstva, to je Korpus bibliotekarstva, ki je prosto dostopen na straneh tega bloga in o katerem je bilo tudi že dovolj napisanega. Pred kratkim smo ga uspešno predstavili tudi širši mednarodni strokovni javnosti jezikoslovcev na znanstveni konferenci v St. Petersburgu.

Katedra za matematično lingvistiko na Državni univerzi v St. Petersburgu je letos konec junija v sodelovanju z Inštitutom za jezikoslovne študije Ruske akademije znanosti in Oddelkom za aplikativno jezikoslovje Ruske državne pedagoške univerze A. I. Hercena že petič organiziral bienalno mednarodno znanstveno konferenco o korpusni lingvistiki Corpora 2013. Uredniški odbor je z veseljem sprejel našo prijavo in nas po predstavitvi s korpusom povezanih aktivnosti in analiz še posebej povabil k sodelovanju v skupino specializiranih korpusov. Konference se je udeležilo 67 strokovnjakov iz 14 držav (Rusije, ZDA, Nemčije, Velike Britanije, Slovaške, Češke, Belorusije, Poljske, Italije, Finske, Francije, Koreje, Belorusije In Slovenije). 54 predstavitev (Program) je obravnavalo različne praktične in teoretične vidike izgradnje in uporabe korpusov v različnih jezikih in na različnih nivojih (pisana in govorjena besedila, knjižni jezik in narečja, splošni in strokovni jezik, starejša besedila ipd.) ter rezultate analiz na področju morfologije, sintakse, semantike in jezikovnih primerjav. Zajeten konferenčni zbornik je zašel tudi v NUK-ov fond (Trudy meždunarodnoj konferencii "Korpusnaja lingvistika - 2013", 25-27 ijunja 2013 g., Sankt-Peterburg / [otvetstvennye redaktory V. P. Zaharov, O. A. Mitrofanova, M. B. Hohlova]. - Sankt-Peterburg : Izdatelʹstvo SPBGU, 2013. - 480 str.), na srečo pa so vsi članki, večina predstavitev in tudi videoposnetkov nastopov dostopni na spletu. Slovenski prispevek Slovene Specialized Text Corpus of Library and Information Science – an Advanced Lexicographic Tool for Library Terminology Research (članek, predstavitev, videoposnetek - žal zelo slaba kvaliteta zvoka) je naletel na dokajšnje zanimanje, kar kažejo tudi nekateri pokonferenčni odmevi.

"Poslušanje v cirilici."

Pri nas na severu je bilo 34,
v Ljubljani pa 19°C.
V muzeju Univerze.

Ne, ni pokopališče. Na kamnih so ploščice z
napisi univerz, s katerimi sodeluje Državna univerza v
St. Petersburgu
Med znanimi alumni Univerze sta tudi predsednika.

Ruska nacionalna knjižnica je vsak zadnji
torek v mesecu zaprta.
Carskoe selo – krajevna knjižnica nedaleč od
svetovno znanih carskih palač.

torek, 2. julij 2013

Super, superca in celo superbralec


© Is The Library Open
V objavi o piškotkih je kolega Franca zbodla slovenska oblika superpiškotek in povsem pravilno poudarja, da ima slovenščina poleg nekoliko modne in "prestižne" tuje predpone super- dovolj ustrezne možnosti za izražanje presežnosti oz. označevanje višjega reda. V tem se z njim povsem strinjam, lepi slovenski primeri so npr. nadangel, nadčlovek, nadbesedilo, nadnaraven, nadgradnja, nadinšpektor, nadnacionalka, nadnaslov, nadporočnik, nadrealizem, nadstandard, nadškof, nadučitelj, nadurni, nadzornik ipd., pri katerih imajo tuje sopomenke navadno predpono super- (latinsko nad), supra- (npr. supralitoral) ali redkeje grško arh- (npr. arhangel, arhiepiskop, arhipelag ipd.) in hiper- (npr. hiperaktiven, hiperpovezava, hipermarket). Za začetek sem pobrskal po nekaterih slovarjih in drugih spletnih virih, da bo bolj jasno, kaj pravi živa raba.

Najnovejši Slovar novejšega besedja slovenskega jezika ( ZRC SAZU, 2013), ki naj bi vsaj malo dopolnjeval sedaj že nekoliko zastareli SSKJ, navaja nekaj "novosti" s predpono nad- (naddržava, nadgraditev, nadjogi, nadlak, nadnacionalka, nadnapis, nadpisati, nadpomenka (sin. hipernim), nadpovezava (sin. link, hiperpovezava, povezava), nadprt, nadstandard, nadstandardni, nadzavarovanje) in precej več takih s predpono super- (superdržava, superhiter, superman (sin. supermoški), supermaraton (sin. ultramaraton), supermaratonec, supermodel (sin. top model), supermodelka, supermoški (sin. superman), superračunalnik, supersonični (sin. nadzvočni), superveleslalom, supervizija, supervizor (vendar brez nadzornika), supervizorka (prav tako ni nadzornice) in superženska. Ob tem še pogovorno superca s pomenom izvrstno oz. kot podkrepitev trditve, in seveda superca kot zares veliko pivo v litrskem vrčku.

Stari SSKJ navaja med gesli manj kot ducat primerov s predpono super-, nekaj pa jih je tudi v besedilu. Samostojno rabo besede ali kot predpono razlaga takole:

súper prid. neskl., pog. 1. ki zelo presega navadne, običajne lastnosti česa: to je super kič / atomska bomba je super orožje 2. izvrsten, odličen: ima super avtomobil; obleka je super • žarg., teh. super bencin visokooktanski bencin; publ. super profit in superprofit ekstra profit; prisl.: super poješ / imam super veliko dela zelo / kot vzklik kako je s teboj? Super
super... ali súper... predpona v sestavljenkah za izražanje a) preseganja navadne, običajne mere: supermarket, supersila, supertanker b) kvalitativnega preseganja: superaristokrat, superavtomat c) visoke stopnje: superekspresen, supermoderen č) ponovitve na drugi, višji stopnji: superanaliza, superarbitraža

Zbirka Besede slovenskega jezika je zajela zelo bogat nabor (887 gesel), med njimi seveda tudi vsakodnevnice kot so supermarket, supervojak, superšportnik, superprevodnik, evrosuper (varianta od super), supertanker ipd. Ker gre za široko žetev besed iz različnih spletnih besedil, so med besedami seveda tudi raznorazne komaj razumljive "cvetke" (npr. supereta, superglup, superidejen ipd.).

GigaFida razkriva 141.686 pojavljanj predpone super-, od tega 4.764 različnih besed, za katere trdi, da so v osnovni obliki (kar pa včasih ne drži, najbrž ponagaja lematizator, ki se mu od hudega malce zvrti ob nekaterih superfinih besedah (med njimi so tudi neslovenske besede in razna čudesa kot supertrepalnice, supermrčes, superplevel, superskupinski , tudi superbralec ipd.). Najpogostejši je samostojni super (51.021), sledi pa mu za Slovence življenjsko pomembni superveleslalom (9.201), na koncu pa je seveda množica besed z enkratnim pojavljanjem (npr. superodlično).

Slovar tujk vsebuje okrog 70 tovrstnih gesel, ki pa so povečini specializirane strokovne narave (npr. supernatant, supernim ipd.) in jih zato ne moremo jemati kot merilo v današnji razpravi.

Google gre z zadetki v milijarde, vendar ti zadetki niso relevantni, ker posega v vse jezike in je slovenska besedila nemogoče dovolj učinkovito izdvojiti. Zanimivo pa je, da najde tudi termina superknjižnica in superknjižničar!

Iz zgornjih primerov rabe in pojavljanja besed s predponama super- in nad- se mi poraja zaključek, ki je žal bolj na nivoju občutka kot strokovne ugotovitve. V primerih, ko prinaša predpona super- pomen večjega, višjega, nadrejenega ipd., je slovenjenje z nad- nekoliko lažje (npr. nadbesedilo, nadinšpektor, nadzornik) kot v primerih, ko je pomen predpone izvrsten, odličen, vrhunski, izjemen, ekstremni, kjer tujo obliko super- raje ohranjamo (npr. superhiter, supermodel, supertanker, superveleslalom, supermoderen, sem bi sodila tudi superknjižnica in superknjižničar, pa seveda tudi superbabica iz istoimenske nadaljevanke za otroke).
Ker gre pri superpiškotku za njegovo kakovost, odličnost in izjemnost (to je vrsta sledilnega piškotka, ki pa ga je mnogo teže odkriti in navadnemu smrtniku tudi nemogoče zbrisati), ne pa nadrejeno, višjo oz. presežno stopnjo glede na druge piškotke, mi gre termin superpiškotek dovolj mehko v uho, vsekakor pa se zavzemam tudi za bolj slovensko sopomenko nadpiškotek. Počakajmo, kaj bosta prinesla čas in raba.