Analiza sentimenta u tekstovima i mikroblogovima o izbjegličkoj krizi (CROSBI ID 421895)
Ocjenski rad | diplomski rad
Podaci o odgovornosti
Raguzin, Ana
Martinčić-Ipšić, Sanda
hrvatski
Analiza sentimenta u tekstovima i mikroblogovima o izbjegličkoj krizi
Mišljenje uvelike utječe na način na koji se osobe ponašaju, djeluju i odlučuju. Prije neke važne odluke, ljudi će pitati za mišljenje svoje bližnje, no razvojem Interneta mijenja se način na koji ljudi izražavaju i traže mišljenja. U današnje vrijeme postoje razni tipovi stranica gdje osobe mogu izraziti svoje stavove: društvene mreže, portali, blogovi, forumi i slično. Međutim, zbog prevelike količine dostupnih podataka teško je dobiti jasno izražene stavove i mišljenja kako pojedinaca tako i ciljanih skupina. Jedan od osnovnih problema predstavlja broj različitih izvora koji sadrže mišljenja što može otežati ljudima traženje onih relevantnih. Što dovodi do sve veća potrebe za automatskim otkrivanjem mišljenja, odnosno analizom sentimenta. Ova vrsta analize postaje sve popularnija u mnogim domenama: politici, zdravstvu, proizvodnji potrošačkih proizvoda, raznim uslugama i slično. Jedan od osnovnih zadataka analize sentimenta je klasifikacija prema polaritetu, odnosno odvajanje tekstova koji sadrže sentiment u tri kategorije: pozitivnu, negativnu i neutralnu. Ovaj rad obuhvaća teoretski dio u kojem su opisani i objašnjeni glavni pojmovi analize sentimenta te istraživački dio koji se bazira na analizi komentara s portala Index i Jutarnji list te mikroblogova vezanih uz temu izbjegličke krize. Analiza je podijeljena u dva dijela: u prvom dijelu je izrađena frekvencijska analiza riječi u rečenici te je izrađen program koji uči i testira klasifikator pomoću pripremljenog korpusa. U rezultatima je dobiveno da su najčešće korištene riječi u komentarima: „bravo“, „čovjek“, „izbjeglica“ i „eu“ , te da klasifikator maksimalne entropije ima najveći postotak točnosti za ovaj korpus. Drugi dio analize se sastoji od usporedbe korištenog vokabulara i ukupnog sentimenta dva skupa podataka koji su prikupljeni u dva različita vremenska perioda. Rezultati su prikazani u obliku histograma i tablica, a program je napisan u programskom jeziku Python. Cilj rada je analizirati podatke i zaključiti koji su stav ljudi imaju u vezi izbjeglica te vidjeti postoji li razlika u stavu kroz određeni vremenski period.
analiza sentimenta, Twitter, klasifikacija, polaritet
nije evidentirano
engleski
Sentiment Analysis of Texts and Tweets Related to War and Immigrant Crises
nije evidentirano
sentiment analysis, Twitter, classification, polarity
nije evidentirano
Podaci o izdanju
60
12.09.2018.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Rijeka