četrtek, 04. avgust 2011

Korpus bibliotekarstva je dosegel milijon besed in je odslej javno dostopen

Besedilni korpus bibliotekarstva je presegel magično mejo enega milijona besed, ki jih črpa iz 144 slovenskih bibliotekarskih strokovnih besedil. Korpus vključuje samo objavljena besedila, ki so že dosegljiva v elektronski obliki. Poudarek je predvsem na zajemu besedil, objavljenih v zadnjem desetletju, glede na možnosti pa kdaj tudi nekatera starejša. Pričakujemo, da nam bo dal korpus, ki ga bomo še dopolnjevali, trdno osnovo za temeljit analitičen vpogled v sodobno bibliotekarsko terminologijo in omogočil učinkovitejše dopolnjevanje Bibliotekarskega terminološkega slovarja.

Upoštevana besedila niso v korpusu dostopna niti v izvirni obliki niti v celoti, za uporabnike so izdelane le hipertekstne povezave na izvirno objavo (npr. dLib.si, arhiv revije Knjižnica, zborniki ipd.). Besedila so uporabljena samo za izdelavo kumulativnih statističnih kazalcev jezika, npr. za sezname besed ali besednih zvez s pogostnostjo, in v konkordančnih seznamih, vendar tudi tam le v obliki ožjega citata ne več kot treh povedi - tekoče povedi, povedi pred njo in povedi za njo. Korpus torej ne posega v avtorske pravice piscev besedil ali založnikov. Kjer prispevki niso prosto dostopni, je zato povezava narejena samo na naslovno stran časopisa (npr. v primeru Knjižničarskih novic).

Pri pripravljanju besedil in za postavitev ter javno spletno uporabo korpusa je bila uporabljena domača programska oprema - urejevalnik besedil Eva in njegova internetna različica NEVA s specifičnimi funkcijami, ki že nekaj let omogočajo delovanje splošnega referenčnega korpusa slovenskega jezika Nova beseda , spletne različice Slovarja slovenskega knjižnega jezika in nekaterih drugih slovarskih in jezikoslovnih orodij.

Korpus bibliotekarstva je zasnoval in pripravil Ivan Kanič, korpus je javno in brezplačno dostopen na spletu pod pogoji licence CC.

Testna verzija korpusa je glede uporabnih funkcij še omejena na konkordančno kazalo, nekatere druge funkcije bomo dodali v kratkem. Vabimo vas, da korpus preizkusite in pokomentirate!

Preizkusite javno dostopni Korpus bibliotekarstva na straneh bloga Bibliotekarska terminologija.

Nekaj navodil v pomoč
pri uporabi Korpusa bibliotekarstva

Iskalni razpon
Standardno poteka iskanje po vseh besedilih (označena je izbira "celotni korpus"). Z izbiro v okencih je mogoče izbrati iskanje po besedilih samo enega tipa ali več tipov dokumentov. V tem primeru je treba izključiti izbiro Celotni korpus.

Postopek
V testni verziji korpusa je aktivna samo izbira Konkordance.
A/a - Omogoča omejevanje iskanja glede na veliko/malo začetnico. Iskanje ne razlikuje med velikimi in malimi črkami, kljukica v okencu pa pomeni poizvedbo z iskalnim nizom, pisanim samo z malo začetnico (primerjaj: knjižnica, Knjižnica)

Iskalni izraz
Standardno poteka iskanje po vpisanem nizu znakov vključno s presledki in vrstnim redom besed.
Maskiranje posameznih znakov ni mogoče.
Dovoljeno je desno krajšanje z znakom *
Primeri

knjižničarskegavse pojavitve besede knjižničarskega
visokošolskim knjižnicamvse pojavitve besedne zveze visokošolskim knjižnicam
knjižnic*beseda knjižnica v vseh sklonih in številih
bibliotekar*besede, ki se začnejo na bibliotekar-
spletn* katalog*besedne zveze z obema besedama v vseh sklonih in številih

Prikaz zadetkov
Standardno se izpiše do 100 zadetkov na stran, nastavitev je mogoče spremeniti. Puščice za listanje po straneh so na dnu izpisa.
Konkordančni seznam izpiše 45 znakov pred iskano besedo in 45 znakov za njo; nastavitev je mogoče spremeniti.
Na desni strani vsakega zadetka se izpiše kodirana oznaka dokumenta, ki s klikom pokaže sobesedilo iskane besede.
Izpišejo se do tri povedi, tekoča poved z iskano besedo, poved pred njo in poved za njo. Nad besedilom je kratek bibliografski opis dokumenta s hipertekstno povezavo do celotnega izvirnega besedila na strežniku, kjer je objavljeno.

Preizkusite javno dostopni Korpus bibliotekarstva na straneh bloga Bibliotekarska terminologija.

2 komentarja:

  1. Čestitke za enormno delo. Martina

    OdgovoriIzbriši
  2. Hvala, Martina!
    Delo gre nezadržno naprej in če pogledaš danes, je korpus že spet nekoliko "obilnejši". Z nekaj sreče bo konec poletja že prav zajeten. Upam . . . ker težav ni malo.

    OdgovoriIzbriši