Osnovna stranica

Metodologija obrade podataka

Razumijevanje problema

Određivanje ciljeva

Prvi važan korak u čitavom procesu obrade podataka jest razumijevanje potrebe da se ovaj proces primjeni, odnosno razumijevanje problema koji želimo riješiti. To je konačni cilj obrade podataka. Konkretni problemi mogu biti vrlo različiti: optimiranje odziva kupaca u planiranju nove marketinške kampanje, prevencija zloupotrebe kreditnih kartica, detekcija hakerskih upada na računalni sistem, itd. Da bi mogli efikasno riješiti problem moramo:

Definiranje kriterija uspješnosti

Nakon što je sam problem definiran, bitno je i odrediti što predstavlja kriterij uspješnosti procesa obrade podataka. Taj kriterij može biti kvantitativno izražen: npr. povećanje broja detektiranih devijacija, povećan broj kupaca nekog produkta, povećan broj točnih dijagnoza pacijenata. Kriteriji mogu biti i subjektivni ili kvalitativni. U tom je slučaju uobičajeno da stručnjak iz čije domene problem dolazi sam ocijeni rezultate procesa obrade podataka s obzirom na postojeća saznanja u području. U tom slučaju rezultati moraju sadržavati neki novi i korisni uvid u odnose varijabli problema, dostupnih kroz skup podataka na raspoloaganju za obradu.

Ocjena situacije

Definirajući osnovni problem i kriterije njegova uspješnog rješavanja, dolazimo na korak u kojem je potrebno ocijeniti sve praktične aspekte procesa obrade podataka.

Određivanje ciljeva procesa obrade podataka

Prethodno definirani problem i kriterij njegova uspješnog rješavanja potrebno je prevesti u terminologiju procesa obrade podataka. Ciljevi obrade podataka razlikuju se od onih specificiranih iz perspektive domene konkretnog problema. Kao ilustracija poslužit će nam slijedeća tablica:

cilj iz perspektive domene problema cilj obrade podataka
povećanje prodaje produkta odrediti svojstva kupaca s obzirom na njihovu kupovnu moć
prevencija zloupotrebe kartica pronaći kritične modele ponašanja prilikom zloupotrebe kreditnih kartica
ili
napraviti algoritam za automatsku detekciju zloupotrebe kreditnih kartica

Definiranje problema i ciljeva obrade podataka direktno je vezano uz osnovnu podjelu na tipove problema iz perspektive procesa obrade podataka. Ovdje ih samo navodimo, dok je njihov detaljniji opis dan u poglavlju Modeliranje.

Konačni izlazni rezultat procesa obrade podataka razlikuje se zavisno od tipa problema i tehnika koje se kasnije odabiru za njihovo rješavanje. Poželjno je u tom smislu definirati željeni oblik konačnog rezultata procesa obrade podataka. Osim toga poželjno je definirati i mjeru uspješnosti takvog rješenja: npr. određeni minimalni nivo prediktivne točnosti rješenja (klasifikacijski ili predikcijski problem), ili pak definirati specifični kriterij za ocjenu kvalitete (odnosno informativnosti) modela, ukoliko se od rješenja traži novi uvid u odnose varijabli iz skupa podataka predviđenog za rješavanje problema.

Projektni plan

Svi prethodni koraci mogu poslužiti za stvaranje okvirnog plana za izvedbu procesa obrade podataka. U tom se planu predviđaju pojedine aktivnosti (dijelovi procesa) i rezultati na kraju tih aktivnosti, te tehnike koje treba primijeniti u pojedinim koracima procesa.


© 2001 LIS - Institut Rudjer Bošković
Posljednja izmjena: October 19 2018 21:25:30.