Postupci strojnog učenja za popravljanje točnosti klasifikacije manjinskih klasa kod nebalansiranih skupova podataka (CROSBI ID 427398)
Ocjenski rad | sveučilišni preddiplomski završni rad
Podaci o odgovornosti
Josipović, Marko
Jović, Alan
hrvatski
Postupci strojnog učenja za popravljanje točnosti klasifikacije manjinskih klasa kod nebalansiranih skupova podataka
Ovaj rad uspoređuje utjecaj postupaka za popravljanje točnosti i njihovih kombinacija na klasifikaciju manjinskih klasa kod nebalansiranih skupova podataka. Za potrebe eksperimentalnog vrednovanja razvijena je web aplikacija. Na temelju rezultata eksperimentalnog vrednovanja donesen je zaključak da odabir postupaka za popravljanje točnosti ovisi o karakteristikama skupa nad kojim se obavlja klasifikacija. Postupci ponovnog uzorkovanja koji su postigli najbolje rezultate nad skupovima podataka odabranima za vrednovanje su: SMOTE te kombinacije SMOTE+ADASYN, SMOTE+Random Under, SMOTE+ADASYN+NearMiss, SMOTE+ADASYN+Random Under, SMOTE+NearMiss+Random Under i kombinacija sva 4 postupka. Osim postupaka ponovnog uzorkovanja uspoređena su dva algoritma klasifikacije, rezultati pokazuju da je za klasifikaciju nebalansiranih skupova podataka ansambl klasifikatora balansirane slučajne šume prikladniji od algoritma k-najbližih susjeda.
poduzorkovanje, naduzorkovanje, ansambl klasifikatora, matrica zabune, F1-mjera
nije evidentirano
engleski
Machine learning methods for improving classification accuracy of minority classes on unbalanced datasets
nije evidentirano
undersampling, oversampling, ensemble of classifiers, confusion matrix, F1 score
nije evidentirano
Podaci o izdanju
21
02.07.2019.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb