Razvoj & Middleware
srijeda, 14. listopad 2015., 11:30
Dv 3 Restoran
30'
U prediktivnoj analizi se često barata s velikom količinom varijabli koje bi mogle biti korisne, no koje mogle biti I irelevantne ili čak kontra produktivne ako bi se uključile u prediktivni model. U praksi su uobičajeni setovi za prediktivnu analizu s 1000 I više varijabli. Dobro obavijena ručna selekcija rezultira ogromnom potrošnjom vremena kao I mogućnošću nastajanja greški u samoj selekciji. U našem pristupu problematici smo implementirali selekcijski proces pomoću Oracle R Enterprise alata te time automatizirali rangiranje korisnosti varijabli. Time smo uspjeli značajno smanjiti završni broj varijabli selekcije; no I usuprot tome očuvali preciznost prediktivnog modela te isto tako značajno smanjili duljinu trajanja cijelog procesa. Naše rješenje predstavlja vrlo pristupačni pregled svih dostupnih varijabli poredanih po mogućoj korisnosti, te radi automatiziranu predselekciju baziranu na važnosti atributa. Rezultati su predstavljeni korisniku u obliku ORE data. frame objekta, grafičkom prikazu te pomoću proračunske tablice kako bi se maksimalizirala korisnost kao I za pristupačnosti mogućoj daljnjoj analizi. S tim na umu je korisniku lako odabrati broj te točno koje varijable koristiti u modelu kako bi se maksimalizirala prediktivnost. U našem predstavljanju možete saznati više o procesu selekcije varijabli u prediktivnoj analizi, naučiti nešto o našem rješenju pomoću Oracle tehnologije te završno I čuti malo više o nekim od naših iskustava u selekciji varijabli.
Konferenciju organizira Hrvatska udruga Oracle korisnika. Više o udruzi možete saznati na Hroug.hr.