Dubinska analiza podataka u radnom okviru Apache Spark pomoću knjižnice MLlib

Penić, Lucia

izvor podataka: crosbi !

Dubinska analiza podataka u radnom okviru Apache Spark pomoću knjižnice MLlib (CROSBI ID 420421)

Ocjenski rad | sveučilišni preddiplomski završni rad

Penić, Lucia Dubinska analiza podataka u radnom okviru Apache Spark pomoću knjižnice MLlib / Jović, Alan (mentor); Zagreb, Fakultet elektrotehnike i računarstva, . 2018

Podaci o odgovornosti

Autori

Penić, Lucia

Mentori

Jović, Alan

Osnovni podaci na izvornom jeziku
Osnovni podaci na ostalim jezicima

Jezik

hrvatski

Naslov

Dubinska analiza podataka u radnom okviru Apache Spark pomoću knjižnice MLlib

Sažetak

Količina informacija kojima smo okruženi eksponencijalno raste i s njom javlja se potreba za novim rješenjima na području znanosti o podacima. Kao jedno od rješenja, pojavio se Apache Spark, sa svojom izuzetno brzom jezgrom namijenjenoj za obradu velikih skupova podataka. Spark ujedinjuje nekoliko ugrađenih biblioteka koje je moguće međusobno kombinirati unutar jedne aplikacije. Ovaj rad fokusira se na korištenje MLliba, knjižice za strojno učenje, u procesu izvlačenja korisnih informacija iz velike količine podataka. Taj proces objašnjen je detaljno, počevši s uputama za instalaciju Apache Sparka, kratkim osvrtom na osnovne koncepte i naposljetku praktičnim primjerom izgradnje cjevovoda za strojno učenje te vrednovanjem rezultata koristeći MLlib.

Ključne riječi

znanost o podacima, Spark ML, strojno uˇcenje, analiza podataka, obrada podataka, sluˇcajna šuma, DataFrame, RDD, veliki podaci, cjevovod, vrednovanje modela

Napomena

nije evidentirano

Jezik

engleski

Naslov

Data mining in Apache Spark framework using MLlib library

Sažetak

nije evidentirano

Ključne riječi

Data Science, Spark ML, machine learning, data analysis, data processing, Random Forest algorithm, DataFrame, RDD, Big Data, pipeline, model evaluation

Napomena

nije evidentirano

Podaci o izdanju

Broj stranica

Datum obrane

06.07.2018.

Status objave rada

obranjeno

Podaci o ustanovi koja je dodijelila akademski stupanj

Ustanova / Organizacija

Fakultet elektrotehnike i računarstva

Mjesto

Zagreb

Povezanost rada

Povezane osobe

Alan Jović (mentor/i)

Povezane ustanove

Fakultet elektrotehnike i računarstva (036) (autorova ustanova)

Područje

Računarstvo

Poveznice

zemris.fer.hr