Osnovna stranica

Metodologija obrade podataka

Uvod

Otkrivanje znanja i obrada podataka

Otkrivanje znanja iz baza podataka (KDD - Knowledge Discovery in Databases (Fayyad et al, 1996), proces je identificiranja ispravnih, novih, potencijalno korisnih i razumljivih modela iz podataka. Obrada podataka (Data Mining) predstavlja korak u tom procesu čiju srž predstavlja primjena specifičnih tehnika (algoritama), koji pod prihvatljivim ograničenjima na računalne resurse mogu generirati modele iz podataka.

Ovo je možda i najcitiranija definicija termina otkrivanja znanja iz podataka i obrade podataka. No, za mnoge termini otkrivanje znanja (KDD) i obrada podataka (DM) su sinonimi. To je i stav autora ovog pregleda, pa će taj pogled na terminologiju i biti osnova našeg pregleda područja obrade podataka.

Praktična obrada podataka zahtijeva mnogo više od upotrebe sofisticiranih tehnika poput neuralnih mreža ili stabla odlučivanja. To je razlog što ovaj pregled počiva na viđenju obrade podataka kao procesa. Osnovni prikaz standardnog procesa obrade podataka dan je na slijedećoj slici. Ovaj pogled na proces poslužio nam je i kao osnova za grananje na objašnjenja specifičnih tehnika i termina. Tehnike modeliranja podataka, koje čine srž samog procesa vuku svoje korijene iz niza različitih područja poput strojnog učenja, statistike, prepoznavanja uzoraka, procesiranja signala. Naša namjera je bila da u ovom pregledu prije svega objasnimo gdje i kada se one koriste. Iako je u pregledu dat i osnovni prikaz važnijih tehnika i metodologije njihove primjene, detaljnija objašnjenja se mogu potražiti koristeći čitav niz veza i referenci danih na pojedinim stranicama pregleda.

Pisanje o specifičnom području poput obrade podataka teško je bez upotrebe specifične terminologije. Da bi se zbog preglednosti izbjeglo objašnjenja u samom tekstu napravljen je poseban prilog (Popis termina), sa detaljnijim objašnjenjima specifičnih termina.




© 2001 LIS - Institut Rudjer Bošković
Posljednja izmjena: April 24 2018 00:46:38.