Idealna situacija za jednog poslodavca je angažovanje nekoga ko može da obavlja najmanje 5 poslovnih uloga i da za to bude plaćen petinom novca kojim bi inače trebalo podržati takav angažman.

Iz poslovne i finansijske perspektive, to je velika investicija, ali da li je realna?

Sindrom velikih očekivanja

Veliki broj poslodavaca koji se po prvi put susreće sa naukom o podacima ima prevelika očekivanja. Nema u tome ničeg lošeg, naprotiv.

Takođe, većina istraživača i profesionalaca sa ekspertizom iz oblasti nauke o podacima prihvata poslovne angažmane bez odgovarajuće podrške za pružanje profitabilnih uvida.

Gde je problem?

Većina kompanija koje posluju na tržištu ima tzv. prljave podatke. Razlog ovome je dugogodišnje prikupljanje i skladištenje podataka bez jasne vizije i potrebe koja je opravdava. Samim tim, kompanije su tokom vremena akumulirale silose podataka koji zauzimaju određeni skladišteni prostor, a ničemu ne služe. Ovi podaci nisu samo nestrukturirani, već imaju nedostatke u smislu pogrešnih i/ili nedostajućih vrednosti i podataka unutar određenih polja itd.

Ovo je velik i vrlo čest problem, u žargonu nazvan GIGO (Garbage In, Garbage Out) ili ukoliko kvalitet ulaznih podataka ne ispunjava očekivanja i ne zadovoljava standarde, vrlo je mala verovatnoća da će kvalitet izlatnih (obrađenih) podataka ispuniti očekivanja.

Za jednog profesionalca u ovoj oblasti, kreiranje prediktivnih analiza i rukovanje podacima u ovom obliku predstavlja vrlo zahtevan i složen posao, jer većina modela zahteva dovoljan uzorak pod različitim uslovima kako bi model obuhvatio što više slučajeva i time stvorio što precizniju predikciju.

Neiskorišćen potencijal

Poslovna praksa kaže da čak 58% istraživača u oblasti nauke o podacima ne uspe da kreira predikcije na osnovu modela tj. dođe do zaključaka na osnovu analize velikih setova podataka u velikom broju ponavljanja.

Pod pretpostavkom da se radi o relevantnim stručnjacima, postoji osnovni problem, kvalitet podataka!