sobota, 17. december 2016

KWIC, KWAC, KWOC


© 7blog
Nekatere druge vrste besednih indeksov so še:
KWWC Key-Word-With-Context Index
KEYTALPHA Key-Term Alphabetical
WADEX Word and Author IndexIt – ena od izpopolnjenih in izboljšanih verzij KWIC-indeksa
AKWICAuthor and keyword in context index – različica kazala WADEX
DKWTC Double KWIC Index – ena od izpopolnjenih in izboljšanih verzij KWIC-indeksa
KLIC Key-Letter-In-Context Index
Tokratni naslov je za prenekaterega nepoučenega bralca zagotovo nenavaden, enigmatičen in čuden, mogoče bo kdo pomislil, da gre za besedno igro, otroško izštevanko ali brezpomenski refren uspavanke za dojenčka. Pa ni nič od tega. Vse tri besede, gre za angleške kratice, predstavljajo zelo resne, pomembne in zapletene reči. Kadar se uporabljajo vse tri skupaj, si navadno sledijo v zgornjem vrstnem redu (ni pa nujno), kdo ve zakaj, morebiti zato, ker so tako lažje izgovorljive, ali pa zato, ker je prva (KWIC) najpomembnejša in nedvomno najpogostejša. Gre za poimenovanje in opis različne organizacije permutiranih besednih kazal. No, iz teh kratic na srečo ne delamo izpeljank (kot npr. FRBR, FZBZ in še kaj hujšega) in torej ne kwikamo, kwakamo ali kwokamo . . .

Učinkovito in kar se da hitro iskanje ter pridobivanje pravih informacij iz velike količine knjig, člankov in drugih dokumentov je bilo že vedno ena od kritičnih točk strokovnega in znanstvenega delovanja, pa seveda temu namenjenih podpornih dejavnosti, to je knjižnic in dokumentacijskih služb. Danes, ko merimo in ocenjujemo iskanje in dostop do relevantnih informacij v sekundah in s številom za to potrebnih klikov, si težko predstavljamo sisteme za poizvedovanje v predračunalniški dobi. Kljub ročni ali "peš tehnologiji" so bili postopki in orodja neverjetno dobri in učinkoviti. V bibliotekarstvu in dokumentalistiki se je kot posebna stroka razvilo indeksiranje, to je označevanje vsebine dokumenta, publikacije z indeksirnimi izrazi, npr. deskriptorji, ključnimi besedami, notacijami določene klasifikacije, zato je v rabi tudi sopomenka vsebinsko označevanje. Historično gledano lahko rečemo, da se je bibliotekarstvo osredotočalo izključno na prekoordinatno indeksiranje, to je določanje indeksnih izrazov že takoj ob vstopu dokumenta v sistem (npr. knjižnico), indeksiranje pa opravi človek, tudi danes. Ti indeksirni izrazi so lahko po njegovi presoji drugačni od besed v dokumentu (npr. v naslovu, abstraktu ipd.) ali celo v drugem jeziku. Uporabnik se mora zato pri iskanju prilagajati sistemu (knjižničnemu katalogu, tezavru, deskriptorskemu sistemu) in jeziku, ki ga knjižnica uporablja (v nemški knjižnici je treba npr. iskati tudi slovenske knjige s pomočjo nemških gesel). Povsem drugačno je postkoordinatno indeksiranje, ki se opravi, ko je dokument že v sistemu, in ki uporablja besede ali besedne zveze iz samega dokumenta, to je ključne besede. Postkoordinatno indeksiranje danes že povsem enačimo z avtomatskim indeksiranjem, čeprav že tudi pred računalnikom ni bilo neznano. Besedna kazala je minuciozno pripravljal človek, v uporabo pa so šle navadno v obliki knjige. Zelo znane so biblične konkordance, to so besedna in imenska kazala s sobesedilom in kazalko na mesto, kjer se pojavljajo v bibliji. Najstarejše znane biblijske konkordance so sestavili bratje dominikanci že v 13. stoletju!

Tudi dobri in koristni izumi, vključno z računalnikom in njegovo uporabo, se pogosto rojevajo pod skrivnostno in temno tančico strahu in/ali zastraševanja, pa najbrž tudi sovraštva. Prve besedne indekse naj bi z računalnikom izdelala CIA kmalu po začetku hladne vojne že leta 1952 iz naslovov potencialno zanimivih/kočljivih/nevarnih dokumentov, širše in koristneje uporabno avtomatsko indeksiranje pa so razvili pri IBM-u šest let kasneje. V začetku šestdesetih let so se pojavili prvi KWIC-indeksi v naravoslovnih znanstvenih revijah in prav ta izdelava in seveda tudi uporaba indeksov iz naslovov in kasneje tudi (celotnih) besedil strokovnih in znanstvenih objav je prinesla akademsko slavo v nadaljevanju obravnavanim besednim kazalom.


Izrez iz KWIC-indeksa znanstvenega časopisa American Political Science Review za leto 1964.
© social science space

KWIC je angleška kratica za ključne besede v besedilu (Key Word In Context), osnovni koncept takega kazala je predlagal za organizacijo knjižničnega kataloga bibliotekar v Manchestru že sredi 19. stoletja, vendar ni uspel, razumljivo je bilo potrebnega preveč natančnega in zamudnega človeškega dela. Zato pa je zaživel z uporabo računalniških orodij in ostal vse do danes najpomembnejši med vsemi besednimi kazali. V knjižnicah in dokumentalistiki se zaradi možnosti iskanja po celotnih besedilih sicer več ne uporablja, ostaja pa nepogrešljiva njegova različica v konkordančnikih za jezikovne analize in raziskave besedil.

KWIC-indeks je permutirano kazalo, urejeno tako, da se v njem pojavi naslov članka (ali poved iz besedila) v novi vrstici tolikokrat, kolikor je v naslovu besed (z izjemo blokiranih besed), vsakič je izpostavljena druga beseda, urejene pa so po abecedi. Kazalo sestavljajo v vsaki vrstici trije segmenti: ključne besede, navadno iz naslova ali tudi glavnega besedila dokumenta, poravnane v središčnem stolpcu, ki predstavljajo za uporabnika iskalni niz; kontekst ali sobesedilo levo in desno od ključnih besed, ki nam natančneje določa pomen oz. rabo ključne besede; identifikacijska koda, ki omogoča dostop do bibliografskih podatkov o dokumentu ali do celotnega dokumenta.

KWAC je angleška kratica za ključne besede in besedilo (Key Word and Context) in je le varianta KWIC-a, saj so besede vzete (iztrgane) iz besedila in abecedno razvrščene na levem robu kazala, na desni pa jih spremljajo naslovi (ali povedi), v katerih se besede pojavljajo (vendar se ključna beseda v njih ne ponovi). Tudi KWOC ali ključne besede zunaj besedila (Key Word Out of Context) je podobna varianta, vendar se pri tem izpisuje desno od besede celoten naslov (poved).

Za razlage se sklicujem na dikcijo Bibliotekarskega terminološkega slovarja (na spletnem portalu Termania), ki obravnava vse tri indekse dovolj izčrpno. Poglejmo še, kako poimenovanje teh kazal prevajajo v nekatere druge jezike.

angleško KWIC-index,
keyword-in-context index
dansko KWIC-indeks
grško ευρετήριο KWIC, ευρετήριο λέξεων-κλειδιών σε συμφραζόμενα
finskoKWIC-indeksi, kwic-hakemisto, Keyword in context-indeksi
francosko index KWIC, mot-clé dans le contexte
hrvaško KWIC-indeks
italijansko indice KWIC
nemško KWIC-Register, keyword-in-context-Register, Stichwort-in-Kontext Register, Schlüsselwort im Kontext
nizozemsko KWIC-register, in-context-register
portugalsko índice KWIC
rusko указатель ключевых слов в контексте, пермутационный указатель ключевых слов заглавий
slovenskoKWIC-indeks, ključne besede v besedilu
srbskoKWIC indeks, indeks ključnih reči u kontekstu, индекс кључних речи у контексту
špansko índice KWIC, palabra clave en el contexto
švedskoKWIC-index
KWIC KWIC-a [kvík] m krat. (ang. Key Word In Context) gl. ključne besede v besedilu
KWAC KWAC-a [kvák] m krat. (ang. Key Word And Context in Key Word Alongside Context) gl. ključne besede in besedilo
KWOC KWOC-a [kvók] m krat. (ang. Key Word Out of Context) gl. ključne besede zunaj besedila
kljúčne beséde in besedílo -ih -ed -- -a ž (krat. KWAC) mn. seznam ključnih besed (1) iz naslovov dokumentov, publikacij, natisnjen in abecedno urejen tako, da vsaka beseda iz naslova enkrat nastopi na prvem mestu, besede, ki tej ključni besedi sledijo, so natisnjene za njo, nazadnje pa so po vrsti natisnjene še besede izpred ključne besede; sin. ključne besede vzdolž besedila; prim. ključne besede v besedilu, ključne besede zunaj besedila
kljúčne beséde v besedílu -ih -ed -- -- ž (krat. KWIC) mn. seznam naslovov dokumentov, publikacij s poudarjenimi posameznimi ključnimi besedami (1) v teh naslovih ter natisnjen in abecedno urejen tako, da se vsak naslov pojavi tolikokrat, kolikor ključnih besed vsebuje; prim. ključne besede in besedilo, ključne besede zunaj besedila, konkordanca
kljúčne beséde zúnaj besedíla -ih -ed -- -- ž (krat. KWOC) mn. seznam ključnih besed (1) iz naslovov dokumentov, publikacij natisnjen in abecedno urejen tako, da se vsaka ključna beseda iz vsakega naslova pojavi enkrat na prvem mestu, sledi pa ji celoten naslov; prim. ključne besede in besedilo, ključne besede v besedilu
kljúčne beséde vzdólž besedíla -ih -ed -- -- ž mn. gl. ključne besede in besedilo
konkordánca -e ž 1. abecedni seznam besed, imen z navedbo mesta omembe v besedilu, urejen tako, da je prikazano tudi sobesedilo; prim. indeks (1) 2. pri vsebinski obdelavi z avtomatskim indeksiranjem izdelan abecedni seznam v publikaciji, dokumentu uporabljenih besed, imen, prikazanih v sobesedilu; prim. ključne besede v besedilu

angleško KWAC-index, keyword-and-context index, keyword augmented.in-centext
dansko KWAC-indeks
grško ευρετήριο KWAC, ευρετήριο λέξεων-κλειδιών και συμφραζομένων
finskoKWAC-indeksi
francosko index KWAC
hrvaško KWAC-indeks
italijansko indice KWAC
nemško KWAC-Register, keyword-and-context-Register, Stichwort- und- Kontext-Register
nizozemsko KWAC-register, met-context-registe
portugalskoíndice KWAC
rusko указатель ключевых слов вне контекста (заглавия документов приводятся полностью)
slovenskoKWAC-indeks, ključne besede in besedilo, ključne besede vzdolž besedila
srbsko KWAC indeks, indeks ključnih reči sa kontekstom,
индекс кључних речи са контекстом
špansko índice KWAC
švedskoKWAC-index
angleško KWOC-index,
keyword-out-of-context index
dansko KWOC-indeks
grško ευρετήριο KWOC, ευρετήριο λέξεων-κλειδιών εκτός συμφραζομένων
finskoKWOC-indeksi
francosko index KWOC, mot clé hors du contexte
hrvaško KWOC-indeks
italijansko indice KWOC
nemško KWOC-Register, keyword-out-of-context-Register, Stichwort-aus-dem-Kontext-Register
nizozemsko KWOC-register, uit-context-register
portugalsko índice KWOC
rusko указатель ключевых слов вне контекста (заглавия документов приводятся в обьёме печатной строки указателя)
slovenskoKWOC-indeks, ključne besede zunaj besedila
srbsko KWOC indeks, indeks ključnih reči van konteksta,
индекс кључних речи ван контекста
špansko índice KWOC, palabra clave fuera del contexto
švedskoKWOC-index


Strma rast uporabe imen kazal KWIC, KWAC in KWOC v besedilih (knjigah) v šestdesetih in sedemdesetih letih ter
skoraj zaton v začetku tega tisočletja. KWIC, ki mu danes pravimo konkordančni niz, se pojavlja najpogosteje. Vir: Google Books Ngram Viewer

KWAC-indeks: ključne besede in besedilo. Vir: Wikipedia
KWOC-indeks: ključne besede zunaj besedila. Vir: Wikipedia

KWIC-indeks: ključne besede v besedilu. Za primer bomo uporabili kar prikaz konkordančnega niza iz besedilnega Korpusa bibliotekarstva.
V srednjem poravnanem stolpcu so rdeče poudarjene ključne besede s sobesedilom levo in desno, v desnem stolpcu pa je oznaka, kje je mogoče to besedilo najti v celoti. Pri našem korpusu je to v prvem koraku sobesedilo nekaj povedi, v drugem koraku pa celotno besedilo dokumenta na spletu.

Ni komentarjev:

Objavite komentar

Opomba: Komentarje lahko objavljajo le člani tega spletnega dnevnika.