sreda, 10. november 2010

Koliko je en kilobajt, megabajt, gigabajt?

Zadnjič smo spregovorili o merskih enotah, danes gremo korak dalje. Ko govorimo o podatkih, navadno uporabljamo enote kilobajt, megabajt in gigabajt, navadni smrtniki (še) ne gremo naprej. Pa si lahko predstavljamo, koliko je en megabajt v primerjavi s člankom, sliko, knjigo? Pri besedilu si lahko pomagamo z enostavno matematiko, tisto iz osnovne šole. Če je ena črka en bajt, na tipkani strani z dvojnim razmikom pa okrog 2000 znakov, kot to hočejo uredniki, je torej ena tipkana stran okrog 2 kB. To pomeni, da je v enem megabajtu okrog 500 strani navadnega besedila. Na eno klasično disketo, tako, ki je današnja mladina več ne pozna in je imela 1,44 MB, gre torej približno 600 strani besedila. Vendar . . . To bi veljalo le v primeru, ko bi besedilo pisali brez kakršnih koli oblikovnih dodatkov in v navadnem urejevalniku, kot je npr. Beležnica v okolju Windows. Tam načeloma še velja, da je en znak en bajt, v sodobnih urejevalnikih pa nikakor ne. Urejevalniki, Word na primer, beležijo v datoteko poleg besedila še vrsto drugih podatkov o oblikovanju besedila, vrsti črk, tabelah, opombah ipd., zato je neposredna primerjava tipkanih strani in količine podatkov dokaj nezanesljiva, a nekakšno primerjavo je vendarle dobro imeti in ta je za orientacijo dovolj dobra.

Tako lahko kaj hitro ugotovimo, da smo že na domači ravni pri delu z računalnikom s količinami podatkov precej visoko, saj se o megabajtih pogovarjamo pri prenosu datotek z interneta, pri navadnem shranjevanju pa je postal gigabajt že skorajda osnovna enota, kadar govorimo o slikovnem in videogradivu, ki ga je vedno več. Tudi besedila pogosto ilustriramo s slikami, grafikoni ali tabelami in datoteke celo s krajšimi besedili naraščajo v desetine megabajtov, isto velja za skenirana besedila.

Zgovorna in dovolj razumljiva je primerjava, da pomeni en terabajt besedilnih podatkov kar 50.000 dreves, ki bi jih morali predelati v papir, če bi hoteli vse te podatke natisniti. In 1 TB danes glede na potrebe in tehnološki razvoj sploh ni veliko. V povprečni trgovini z računalniško opremo je mogoče kupiti prenosni zunanji disk s tako zmogljivostjo in v velikosti malo večje žepne knjige že za 100 evrov ali manj, mularija pa za igrice in filme kupuje že tudi 2T diske, ki stanejo toliko, kot 20 pic v povprečni slovenski piceriji. Koliko je to dreves!?! Vsaj ena vsem razumljiva in sprejemljiva dobra lastnost elektronskega shranjevanja podatkov.

V računalništvu, posebaj pri navajanju velikosti pomnilnika (in elektronsko knjižnično gradivo sodi v to skupino), je pogosta raba predpon, osnovanih na potencah števila 2, ne pa 10, kot to poznamo v vsakodnevnem življenju, zato prihaja do razkoraka med vrednostmi. Očitno razliko opazimo že pri 1k, kjer je v dvojiškem sistemu ta "presežek" že 24 bajtov, pri velikih količinah pa je odstopanje seveda še večje. Za naše potrebe lahko to razlikovanje spregledamo in ne upoštevamo natančnih vrednosti, ki izhajajo iz dvojiškega sistema (torej 1M je ena milijarda).





k = 210 = 1.024
M = 220 = 1.048.576
G = 230 = 1.073.741.824
T = 240 = 1.099.511.627.776
P = 250 = 1.125.899.906.842.624

Pripravili smo tabelo s približno oceno količine podatkov in primerjavo s tradicionalnimi mediji. Vrednosti so zaradi količin in večje ilustrativnosti zaokrožene navzgor ali navzdol.

1 bajt en znak, črka
10 bajtov ena beseda naravnega jezika
100 bajtov en tvit, krajši SMS, luknjana kartica (zgodovina računalništva)
1 kilobajt šala, kratka zgodbica, izvleček
10 KB stran v enciklopediji
50 KB stisnjena digitalna slika strani dokumenta
100 KB fotografija nizke ločljivosi, članek v PDF formatu
500 KBdaljši članek v PDF formatu, elektronska knjiga za bralnik (stisnjena oblika)
1 MB roman, ena 3,5 palčna disketa
2 MB fotografija visoke ločljivosi, Tolstojeva Vojna in mir za bralnik (stisnjena oblika)
5 MB celotna zbrana dela W. Shakespearja; 30 sekund videa prenosne (broadcast) kakovosti; Cankarjevo Moje življenje (skenirana verzija na dLib.si)
10 MB minuta visoko kvalitetnega zvočnega posnetka; digitani rentgenski posnetek pljuč; škatka 3,5 palčnih disket
50 MB digitalni mamogram
100 MB dva zvezka enciklopedije; (meter) polica knjig
500 MB CD-ROM
1 GB visoko kvaliteten posnetek simfonije, film prenosne kakovosti
20 GB visoko kvaliteten zvočni posnetek Beethovnovih del
50 GB knjige v enem nadstropju knjižnice
100 GB nadstropje znanstvenih časopisov v knjižnici
1 TB potiskan papir iz lesa 50.000 dreves; vsi rentgenski filmi velike bolnišnice; dnevni podatki EOS (Earth Orbiting System, 1998)
2 TB vsi dokumenti velike ameriške znanstvene knjižnice
10 TB tiskano gradivo Kongresne knjižnice
50 TB vsebina večjega sistema za hranjenje podatkov
1 PB podatki EOS za 3 leta
2 PB gradivo vseh visokošolskih knjižnic v ZDA
20 PB vsi leta 1995 izdelani trdi diski
200 PB vse tiskano gradivo na svetu
5 EB vse doslej izgovorjene besede v zgodovini človeštva
Vir: Banović, Zoran: Koliko je to? Moj mikro, 7. maj 2007

2 komentarja:

  1. Tukaj pa je treba omeniti vedno bolj uveljavljeno "binarno" predpono kibi, mebi,...

    OdgovoriIzbriši
  2. Najbrž res, potem bi prihranili kakemu nadobudnežu veliko razočaranje, ko bo kupil 1TB disk, ga doma priključil in "ugotovil", da zmore samo dobrih devetsto milijard bajtov in ne pričakovanih tisoč! Pri USB ključku se je najbrž že marsikdo spraševal, kaj se dogaja, ko na novem in praznem klikne "Lastnosti" in se zapišeta dve protislovni cifri.

    OdgovoriIzbriši

Opomba: Komentarje lahko objavljajo le člani tega spletnega dnevnika.