Big data – zaista veliki, ili samo uobičajeni podaci?

Autor: Alen Gojčeta , 12. lipanj 2013. u 22:00

Sve je prisutniji rast digitalnih podataka iz raznolikih izvora poput društvenih mreža ili senzora.

Big data jedan je od "onih" pojmova. Svi o njemu govore, a nitko nije uvjeren da zna točno o čemu se radi. Ukratko, radi se o pojmu koji označava paradigmu sveprisutnog rasta digitalnih podataka iz raznolikih izvora poput društvenih mreža ili senzora te tehnologije i koncepte za iskorištavanje tako nastalih "velikih podataka".

Možda najveću zabunu u razumijevanje big data koncepata i tehnologija unosi riječ "veliki". Suvremene tijekove digitalnh podataka obilježvaju tri temeljne odrednice – volumen, raznolikost i brzina njihova nastanka (učestalost) i protoka. Takav promet stvaraju, primjerice, mobilni telefoni čiji je broj pretplata već 2012. godine globalno dosegao 4,6 milijardi. Mnoge od tih pretplata se više ne odnose na uređaje koje u ruci drže ljudi i koriste ih za govornu komunikaciju. Telefoni su postali platforme za generiranje podataka i to masivno genereriranje podataka. 

Proizvodnja podataka
Osim što ih koristimo za pristup internetu, slanje digitalnih fotografija, gledanje filmova i slušanje radija putem interneta ili komunikaciju na društvenim mrežama, sve su češći slučajevi korištenja mobilnih pretplata kao platformi bežičnog podatkovnog povezivanja za razne namjene. Tako ćemo danas naći SIM kartice u alarmnim sustavima automobila pa čak i bicikala, u daljinski upravljanim maketama helikoptera, u brojačima prometa, u senzorima i mjernim stanicama poput onih meteoroloških ili vatrodojavnih. Sva ta mjesta, kao i mnoga druga sa ili bez veze na internet, masivno i globalno proizvode podatke koji su iskoristivi, veliki i česti. Ako je tako, kako onda riječ "veliki" može zbunjivati? Bit tih podataka nije samo postojanje golemih količina koje se proizvode diljem svijeta, nego i njihova raznolikost. Tako da bi možda pogodniji naziv bio "široki podaci" (wide data) upravo iz razloga što je raznolikost jedan od glavnih uzroka njihove veličine. Naime, ako dostupne podatke promatramo s aspekta ustaljenih gledišta (paradigmi), tada njihova veličina zaista dolazi u pitanje. Povijesno smo uvijek podatke promatrali prema veličinama transakcijskih baza podataka ili veličinama pripadajućih izvještajnih skladišta podataka. Kad bismo tu stali, cjelokupna baza hrvatskih poslovnih podataka mogla bi prostorno stati u nekoliko kvadrata dobro dimenzioniranog sustava za pohranu podataka. Međutim, veliki podaci su više od toga. Jedan sat videa visoke rezolucije (HD Video) zauzima 11 do 12 GB kapaciteta za pohranu. Isti kapacitet bismo dobili kada bi se digitalizirali tekstualni podaci, gotovo 250 punih arhivskih ormarića nalik onima u kakvima su pohranjeni naši zdravstveni kartoni u liječničkoj ordinaciji. Dakle, velike podatke moramo promatrati u kontekstu raznolikosti izvora. Napretkom tehnologije postali su dostupni algoritmi koji omogućavaju stjecanje uvida iz slika ili video zapisa, poput prepoznavanja lica ili neobičnog ponašanja u trgovini.

Hrvatska i big data tehnologije
U šumi velikih brojeva poput 40 milijardi fotografija pohranjenih na Facebooku ili dvije milijarde ljudi s pristupom internetu, možemo se prepasti i pitati gdje je tu Hrvatska i jesmo li kao zemlja uopće podobni za korištenje big data tehnologija. Odgovor na takvo pitanje je "da" jer big data tehnologije analiziraju podatke kao takve, ali uzimaju u obzir i njihovu raznolikost te brzinu protoka. Kada se tako gledaju podaci, izvan tradicionalnih transakcijskih sustava, tada ni big data prilika nije samo za velike.

Komentirajte prvi

New Report

Close