ponedeljek, 08. oktober 2012

Korpus bibliotekarstva se je čez počitnice "zredil"

Ideja o besedilnem korpusu bibliotekarstva je zorela in se medila dalj časa, potem pa je korpus sredi leta 2011 vendarle zaživel in takoj postal na spletu tudi javno dostopen, najprej samostojno, kamlu pa tudi na blogu Bibliotekarska terminologija kot posebna stran. V kratkem času je zajel okrog 1,8 milijona besed iz več kot dvestotih slovenskih strokovnih in znanstvenih besedil s področja bibliotekarstva in se izkazal kot zelo koristno in praktično orodje pri slovarskem in terminološkem delu. Zanimanja je bil deležen tudi izven bibliotekarskih krogov.

Velik uspeh pa beležimo pri razvoju korpusa tudi letos! Bibliotekarska terminološka komisija je januarja v sodelovanju z Zvezo bibliotekarskih društev Slovenije prijavila projekt njegove nadgradnje na javni razpis s področja predstavljanja, uveljavljanja in razvoja slovenskega jezika (takrat še) Ministrstva za kulturo. Na projektni razpis JPR-UPRS-2012 je prispelo 84 vlog, strokovna komisija Ministrstva za kulturo za slovenski jezik je za sofinanciranje podprla 11 najviše ovrednotenih projektov in med njimi je bil tudi Korpus bibliotekarstva kot "vsebinsko ustrezen in prepričljivo predstavljen projekt z dobrim strokovnim zaledjem in perspektivnim razvojem."

Dopolnjevanje korpusa s skoraj 400 dodatnimi besedili, predvsem članki iz strokovne revije Knjižnica, je tako leta 2012 finančno podprlo Ministrstvo za izobraževanje, znanost, kulturo in šport v okviru Javnega razpisa za sofinanciranje projektov, namenjenih predstavljanju, uveljavljanju in razvoju slovenskega jezika v letu 2012 - JPR-UPRS-2012. To nam je omogočilo vključitev skoraj vseh danes v elektronski obliki dostopnih člankov iz te strokovne oz. znanstvene revije in popolno pokrivanje letnikov od 1997 do 2011, kot zanimivost pa še 22 člankov iz prvega letnika, ki je izšel 1957. Z dodanimi več kot 1,8 milijona besedami se je obseg korpusa podvojil in danes presega 3,6 milijona besed iz 626 strokovnih in znanstvenih besedil, grobo porazdelitev pa prikazuje spodnja razpredelnica.

BesedilBesed
     Celotni korpus 626     3.660.900     
     Doktorske disertacije 4     215.000     
     Magistrska dela 21     596.000     
     Diplomska dela 17     319.000     
     Revija Knjižnica 454     1.956.000     
     Organizacija znanja 31     102.000     
     Knjižničarske novice 21     40.000     
     Prispevki v zbornikih 59     212.000     
     Drugi članki in sestavki 9     13.900     
     Monografske publikacije 10     207.000     

Selektivni seznam za korpus potencialno zanimivih besedil obsega še okrog 150 doslej objavljenih enot. Korpus bo vključeval samo objavljena besedila, ki so že javno dosegljiva v elektronski obliki. Poudarek bo na analizi besedil, objavljenih v zadnjem desetletju, glede na možnosti pa kdaj tudi starejših. Vsekakor bo velika skrb veljala tudi vključevanju najnovejših spletno dostopnih besedil, žal pri tem pogrešamo predvsem zaključna dela študija bibliotekarstva. Dinamika dopolnjevanja bo odvisna od prostovoljnega dela sodelavcev in razpoložljivosti besedil v elektronski obliki.

Ni komentarjev:

Objavite komentar