Korpusno jezikoslovje je sodobna veja jezikoslovja, ki raziskuje značilnosti in zakonitosti naravnega jezika na podlagi obsežnega empiričnega vzorca besedil iz vsakdanje javne jezikovne rabe. V jezikoslovju je korpus oziroma
besedilni korpus velika in strukturirana zbirka besedil, navadno grajena, hranjena in obdelana računalniško. Korpuse se uporablja za statistične analize pisanega in/ali govorjenega jezika, za preverjanje pojavitev besed in besednih zvez ali pa za potrditev lingvističnih pravil v določenem jeziku. So tudi nepogrešljivo in nadvse koristno orodje ob pripravi splošnih in tudi
terminoloških slovarjev. Korpuse so že v predračunalniškem času izdelovali tudi ročno, taki so bili seveda prava redkost in skoraj čudež, danes pa so to praviloma računalniške zbirke podatkov shranjene na digitalnih medijih in nekatere tudi javno dostopne na spletu. Prvi digitalizirani besedilni korpus (
Brown Corpus) vsebuje besedila v ameriški angleščini in je nastal že v šestdesetih letih preteklega stoletja. Korpusi druge generacije so povezani z razvojem tehnologije, ki omogoča njihovo delovanje in uporabo, in so nastali v sodelovanju raziskovalnih, univerzitetnih in pogosto tudi založniških okolij. Prosto dostopna reprezentativna referenčna jezikovna korpusa za slovenski jezik sta
Nova beseda in
Gigafida, nekaj pa je tudi za posebna strokovna področja specializiranih korpusov, vendar vsi niso javni ali pa za njih pogosto ne vemo (npr. dvojezični
Evrokorpus - vzporedni korpus prevodov ali pa
Vayna
s četrt milijona besed iz 360 časopisnih člankov, ki so v času od aprila do avgusta 1998 obravnavali ti. "
verbalne napade na JLA" (malo manj mladi se še spominjamo procesa JBTZ). O vseh naštetih sem na tem mestu pred časom že nekajkrat
pisal. Dokaj bogat specializiran besedilni korpus imamo Slovenci tudi za področje bibliotekarstva, to je
Korpus bibliotekarstva, ki je prosto dostopen na straneh tega bloga in o katerem je bilo tudi že
dovolj napisanega. Pred kratkim smo ga uspešno predstavili tudi širši mednarodni strokovni javnosti jezikoslovcev na znanstveni konferenci v St. Petersburgu.
Katedra za matematično lingvistiko na Državni univerzi v St. Petersburgu je letos konec junija v sodelovanju z Inštitutom za jezikoslovne študije Ruske akademije znanosti in Oddelkom za aplikativno jezikoslovje Ruske državne pedagoške univerze A. I. Hercena že petič organiziral bienalno mednarodno znanstveno konferenco o korpusni lingvistiki Corpora 2013. Uredniški odbor je z veseljem sprejel našo prijavo in nas po predstavitvi s korpusom povezanih aktivnosti in analiz še posebej povabil k sodelovanju v skupino specializiranih korpusov. Konference se je udeležilo 67 strokovnjakov iz 14 držav (Rusije, ZDA, Nemčije, Velike Britanije, Slovaške, Češke, Belorusije, Poljske, Italije, Finske, Francije, Koreje, Belorusije In Slovenije). 54 predstavitev (Program) je obravnavalo različne praktične in teoretične vidike izgradnje in uporabe korpusov v različnih jezikih in na različnih nivojih (pisana in govorjena besedila, knjižni jezik in narečja, splošni in strokovni jezik, starejša besedila ipd.) ter rezultate analiz na področju morfologije, sintakse, semantike in jezikovnih primerjav. Zajeten konferenčni zbornik je zašel tudi v NUK-ov fond (Trudy meždunarodnoj konferencii "Korpusnaja lingvistika - 2013", 25-27 ijunja 2013 g., Sankt-Peterburg / [otvetstvennye redaktory V. P. Zaharov, O. A. Mitrofanova, M. B. Hohlova]. - Sankt-Peterburg : Izdatelʹstvo SPBGU, 2013. - 480 str.), na srečo pa so vsi članki, večina predstavitev in tudi videoposnetkov nastopov dostopni na spletu. Slovenski prispevek Slovene Specialized Text Corpus of Library and Information Science – an Advanced Lexicographic Tool for Library Terminology Research (članek,
predstavitev,
videoposnetek - žal zelo slaba kvaliteta zvoka) je naletel na dokajšnje zanimanje, kar kažejo tudi nekateri pokonferenčni odmevi.
|
|
|
"Poslušanje v cirilici." |
Pri nas na severu je bilo 34, v Ljubljani pa 19°C. |
V muzeju Univerze. |
Uspešen prodor v ugledno družbo, kapo dol, kolega!
OdgovoriIzbriši