Dubinska analiza podataka u radnom okviru Apache Spark pomoću knjižnice MLlib (CROSBI ID 420421)
Ocjenski rad | sveučilišni preddiplomski završni rad
Podaci o odgovornosti
Penić, Lucia
Jović, Alan
hrvatski
Dubinska analiza podataka u radnom okviru Apache Spark pomoću knjižnice MLlib
Količina informacija kojima smo okruženi eksponencijalno raste i s njom javlja se potreba za novim rješenjima na području znanosti o podacima. Kao jedno od rješenja, pojavio se Apache Spark, sa svojom izuzetno brzom jezgrom namijenjenoj za obradu velikih skupova podataka. Spark ujedinjuje nekoliko ugrađenih biblioteka koje je moguće međusobno kombinirati unutar jedne aplikacije. Ovaj rad fokusira se na korištenje MLliba, knjižice za strojno učenje, u procesu izvlačenja korisnih informacija iz velike količine podataka. Taj proces objašnjen je detaljno, počevši s uputama za instalaciju Apache Sparka, kratkim osvrtom na osnovne koncepte i naposljetku praktičnim primjerom izgradnje cjevovoda za strojno učenje te vrednovanjem rezultata koristeći MLlib.
znanost o podacima, Spark ML, strojno uˇcenje, analiza podataka, obrada podataka, sluˇcajna šuma, DataFrame, RDD, veliki podaci, cjevovod, vrednovanje modela
nije evidentirano
engleski
Data mining in Apache Spark framework using MLlib library
nije evidentirano
Data Science, Spark ML, machine learning, data analysis, data processing, Random Forest algorithm, DataFrame, RDD, Big Data, pipeline, model evaluation
nije evidentirano
Podaci o izdanju
27
06.07.2018.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb