Megatrend: Big data i prediktivna analitika

image

Danas se ubrzano gomilaju velike količine podataka dostupnih kako iz vanjskog okruženja, kao npr. s društvenih mreža, WEB stranica, o vremenskim prilikama, situacijama na tržištu, sadržajima konkurentskih WEB stranica, tako i iz unutarnjeg okruženja tvrtki.  Ukratko rečeno, susrećemo se s rastom kompleksnosti podataka: veći broj različitih tipova podataka, veće količine podataka, veća brzina generiranja novih podataka, kao i sve većom kompleksnošću analitičkih procesa. Ako prihvatimo definiciju Big data termina kao „skup podataka toliko velik i kompleksan da je njegovo procesiranje (prihvat, pohrana, pretraživanje, dijeljenje, pretvorba, analiza i vizualizacija) korištenjem tradicionalnih alata i aplikacija postalo teško“, vidimo da se s tim srećemo na dnevnoj bazi, kako u vlastitoj tvrtci, tako i kod korisnika. 

Megatrend je aktivan na području poslovne analitike  punih dvanaest godina - od samih početaka primjene BI-ja u Hrvatskoj. U tom razdoblju su odrađeni brojni projekti izgradnje skladišta podataka, izvještajnih sustava, elektroničkog planiranja i zajedno s njima rješavali poslovne i tehnološke izazove. 

Trenutačno se u svijetu  uz rješenja  bazirana na tradicionalnim sustavima poslove analitike koja se kontinuirano nadograđuju i razvijaju, pojavljuju novi kompleksni tipovi podataka koje korisnici žele analizirati – a pojavljuju se nikad prije viđenom brzinom.

Kako pronaći tehnološkog partnera koji može isporučiti cijeli novi analitički ekosustav koji uz razvoj i podršku tehnologije koje prate nove poslovne potreba, podržava i cijeli spektar postojećih tradicionalnih rješenja poslovne analitike, i to naravno uz zadržavanje nadzora nad podacima i integraciju postojećih s novim sustavima?  Tehnologiju za ove potrebe nudi IBM, čiji je Megatrend dugogodišnji partner na području poslovne analitike. Američki gigant je već identificirao sve te zahtjeve i razvio tehnologiju koja se uspješno nosi s rastućim potrebama tržišta. 

U svom portfelju IBM posjeduje velik broj integriranih tehnoloških komponenti kao što su  različiti engini za analize u realnom vremenu; različiti uređaji (appliances) razvijeni i optimizirani za posebne namjene; posebni softverski alati za prediktivnu analitiku; aplikacije i alati za analize sadržaja; ugrađeni predlošci za brzu primjenu pri analitičkom procesiranju; te integrirani alati za upravljanje podacima u ovom novom proširenom analitičkom okruženju.  

Tehnološki noviteti iz IBM-a 

Osim nama poznatog alata IBM Cognos 10 s kojim svakodnevno radimo već niz godina, IBM Netezza i IBM SPSS Modeler tehnološki su noviteti (na tržištu postoje nekoliko godina, no trenutno još nisu u aktivnoj primjeni u Hrvatskoj) koje smo izabrali kao alate  kojima ćemo svojim korisnicima ponuditi i omogućiti rast i razvoj ukorak s vremenom. Korisnicima treba previše vremena da dođu do odgovora kad koriste tradicionalne  tehnologije: koriste kompleksnu infrastrukturu, sama je rješenja kompleksno upogoniti, troši se puno vremena na podešavanja sustava, nisu dovoljno efikasni u analitici, potreban je veći broj ljudi za održavanje i skupi su za održavanje.  IBM Netezza je uređaj (appliance) koji rješava spomenute probleme korisnika: dedicirani uređaj dizajniran samo za namjenu u poslovnoj analitici, optimiziran za svoju svrhu,  pruža kompletno rješenje, brzo se instalira, jednostavan je za upotrebu, ima standardna sučelja i jeftiniji je za održavanje. Netezza je iznimno fleksibilna analitička platforma koja nudi maksimalne performanse pri  enormno velikim količinama podataka koji se procesiraju. Integrirani uređaj, jednostavan za upotrebu, dramatično ubrzava cijeli analitički proces.

Interface i paralelna arhitektura omogućuju pomak najvećeg dijela analitičkog procesa unutar samog uređaja neovisno o tom odrađuje li se analitika u SAS-u ili nekom drugom alatu, te je li napisana u Javi, Pythonu ili Fortranu. Dovodeći analitiku direktno do podataka, prestaje potreba za prebacivanjem podataka na druge lokacije te samim tim i potreba za pre-procesiranje i transformacije. Upiti se mogu postavljati na same podatke bez ikakvih prepreka ovisno o infrastrukturi. Različiti se modeli mogu brzo isprobavati kako bi se pronaći oni koji najbolje odgovaraju konkretnom problemu. Sama se skladišta podataka kreiraju unutar uređaja. Podaci ostaju na jednom repozitoriju bez potrebe da ih se distribuira unutar organizacije. Prediktivni model može se napraviti na istom  mjestu gdje su i podaci, s ostalim procesiranjem, a rezultati se dobivaju gotovo u realnom vremenu. 

IBM Netezza ima ugrađeno više od 200 statističkih funkcija kao i funkcija rudarenja podataka. Također ima i ugrađene interface za komercijalne pakete kao što su IBM SPSS, SAS, Revolution Analytics, fuzzy Logix, Zementis i drugi. Također ima i interface na Appache Hadoop. 

Alat za prediktivnu analitiku 

IBM SPSS Modeler softverski je alat za prediktivnu analitiku. Korisnicima omogućuje kreiranje prediktivne analitike otkrivajući uzorke i odnose među podacima. Podaci mogu biti strukturirani ili nestrukturirani. Strukturirani su na primjer dob, spol, bračni status, prihod, dok su nestrukturirani bilješke o korisnicima, bilješke o pozivima u call-centru,  sadržaji objava na društvenim mrežama i slično. Iz nestrukturiranih se podataka ekstrahiraju pojmovi i povezuju s  osjećajima (sentiment) te se koriste u modeliranju procesa. Kombinirajući nečije stavove (ponašanja) s nekim atributima (na primjer demografskim) povećava se točnost kreiranih modela. 

Prediktivna analitika omogućuje tvrtkama da postanu proaktivne, predviđajući ponašanja klijenata na osnovu postojećih podataka, a ne samo na osnovu osobnih procjena i intuicije.

Portfelj SPSS-a vrlo je širok ako promatramo njegove mogućnosti – od prikupljanja podataka, analize društvenih mreža sa CCI, statistike, rudarenja podataka sve do upravljanja odlukama.

Uobičajeno područje primjene prediktivne analitike je analitika korisnika. To omogućuje tvrtkama da bolje razumiju potrebe korisnika i predvide što će korisnik učiniti.  Pomoću efikasnijeg dobivanja novih kupaca, povećanja prodaje i profitabilnosti kod postojećih kupaca i zadržavanja profitabilnih kupaca tvrtke povećavaju svoje prihode i profit – ulaganje u ovakve alate brzo dovodi do povrata investicije. 

Analitika operacija uglavnom se koristi prilikom upravljanja imovinom, na primjer za definiranje potrebnog skladišta materijala, robe ili proizvoda ili za definiranje potrebne nabavke kako bi se održala proizvodnja. Također se može koristiti za predviđanja kad koje strojeve ili pogone treba servisirati kako bi se izbjegli nenadani kvarovi i zastoji u proizvodnji. Upravljanjem imovinom i održavanjem optimalnog nivoa imovine maksimizira se kapital. Zadnja grupa primjene prediktivne analitike ja pri detektiranju rizika, prijetnji i prevara. U tom se području analitika koristi za detektiranje sumnjivih transakcija. Sustavi se nadziru, uočavaju se neuobičajena ponašanja odnosno transakcije te kontrolira provođenje akcija koje nastaju nakon detekcije. 

ISKOPALI SMO: Prediktivna analitika omogućuje predviđanje ponašanja na osnovu postojećih podataka. 

PROMO ČLANAK

Podijeli