sobota, 08. december 2012

Rudarjenje malo drugače


© Vlaki.Info
Obvladovanje ogromnih količin podatkov, s katerimi se je soočal, je za človeka vedno predstavljalo izziv, ki ga je dokaj uspešno reševal, čeprav včasih z zamudo. Zadnja desetletja so bila tako v duhu podatkovnih zbirk različnih vrst in tipov, poudarek pa je bil poleg organizacije in hranjenja podatkov predvsem na učinkovitem dostopu do njih, kar so reševale različne oblike iskanja in poizvedovanja (o terminološkem enačenju in/ali razlikovanju izrazov find/search oz. slovenskih ustreznikih iskati/poizvedovati kaj več kdaj drugič). Danes zaradi vse večjih potreb po učinkovitem dostopu do kakovostnih in povezanih podatkov in informacij tudi to več ne zadošča, pojavilo se je podatkovno rudarjenje. Definicij podatkovnega rudarjenja je mnogo in gledajo nanj z različnih uporabniških zornih kotov, vse pa imajo skupno osnovno pojmovanje.

Podatkovno rudarjenje je postopek avtomatiziranega raziskovanja, analize ter odkrivanja značilnih in pomembnih vzorcev, modelov in zakonitosti ter znanja iz ogromne količine podatkov, shranjenih v podatkovnih zbirkah, podatkovnih skladiščih in drugih informacijskih odlagališčih. Najbolj znane metode podatkovnega rudarjenja so statistične metode in metode z nevronskimi mrežami, ki izvirajo iz raziskav strojnega učenja na področju umetne inteligence. Samo skladiščenje podatkov, že znana poizvedovanja in obdelava podatkov, informacijski sistemi za podporo odločanju, vizualizacija podatkov ipd. ne sodijo v podatkovno rudarjenje.

Kot smo tega že vajeni, se je v začetku slovenščina oklenila angleškega izraza data mining, vendar so se mu kmalu pridružili tudi poizkusi slovenjenja kot so odkrivanje zakonitosti v podatkih, rudarjenje podatkov, rudarjenje po podatkih, podatkovno rudarjenje, izkopavanje podatkov, izkop podatkov, kopanje podatkov, kopanje po podatkih, iskanje podatkov, izkoriščanje podatkov, odkrivanje podatkov in še kaj. Kot kaže, sta se najbolj udomačila in razširila podatkovno rudarjenje (v korpusu GigaFida 79 pojavljanj, Nova beseda 24, Korpus bibliotekarstva 34) in rudarjenje podatkov (GigaFida 42 pojavljanj, Nova beseda 20, Korpus bibliotekarstva 0).

Islovar, terminološki slovar informatike, se je odločil za oba, vendar je dal prednost podatkovnemu rudarjenju, ki ima zato razlago, in podredil sopomenko rudarjenje podatkov, ki zato v slovarju ostaja brez razlage in ima samo kazalko na prvega. Glede na vrsto obravnavanih podatkov navaja slovar še nekaj sestavljenk in seveda vse sopomenke:

  • besedilno rudarjenje -ega -a s (ang. text mining) gl. rudarjenje besedil
  • izkopavanje podatkov -a -- s (ang. data mining, datamining) neustr., gl. podatkovno rudarjenje
  • odkrivanje zakonitosti v podatkih -a -- -- -- s (ang. data mining, datamining) gl. podatkovno rudarjenje
  • podatkovno rudarjenje -a -- s (ang. data mining) odkrivanje vzorcev v množici podatkov, ki navadno sloni na statističnih metodah ali metodah strojnega učenja; sin. odkrivanje zakonitosti v podatkih, rudarjenje podatkov
  • podatkovno rudarjenje besedil -ega -a -a s (ang. text mining, text data mining) podatkovno rudarjenje v veliki količini besedil; sin. rudarjenje besedil
  • podatkovno rudarjenje spleta -ega -a -- s (ang. web mining, web data mining) podatkovno rudarjenje po podatkih, dostopnih na spletu; sin. rudarjenje spleta,spletno rudarjenje
  • rudarjenje besedil -a -- s (ang. text mining) podatkovno rudarjenje v veliki količini besedil; sin. besedilno rudarjenje; prim. rudarjenje spleta
  • rudarjenje podatkov -ega -a s (ang. data mining) gl. podatkovno rudarjenje
  • rudarjenje spleta -a -- s (ang. web data mining, web mining) podatkovno rudarjenje po podatkih, objavljenih na spletu; sin. podatkovno rudarjenje spleta, spletno rudarjenje; prim. rudarjenje besedil
  • rudarjenje toka podatkov -a -- -- s (ang. stream data mining, data stream mining) podatkovno rudarjenje v podatkovnem toku
  • spletno rudarjenje -ega -a s (ang. web data mining, web mining) gl. podatkovno rudarjenje spleta in rudarjenje spleta

Ni komentarjev:

Objavite komentar