Nalazite se na CroRIS probnoj okolini. Ovdje evidentirani podaci neće biti pohranjeni u Informacijskom sustavu znanosti RH. Ako je ovo greška, CroRIS produkcijskoj okolini moguće je pristupi putem poveznice www.croris.hr
izvor podataka: crosbi !

Analiza sentimenta u tekstovima i mikroblogovima o izbjegličkoj krizi (CROSBI ID 421895)

Ocjenski rad | diplomski rad

Raguzin, Ana Analiza sentimenta u tekstovima i mikroblogovima o izbjegličkoj krizi / Martinčić-Ipšić, Sanda (mentor); Rijeka, . 2018

Podaci o odgovornosti

Raguzin, Ana

Martinčić-Ipšić, Sanda

hrvatski

Analiza sentimenta u tekstovima i mikroblogovima o izbjegličkoj krizi

Mišljenje uvelike utječe na način na koji se osobe ponašaju, djeluju i odlučuju. Prije neke važne odluke, ljudi će pitati za mišljenje svoje bližnje, no razvojem Interneta mijenja se način na koji ljudi izražavaju i traže mišljenja. U današnje vrijeme postoje razni tipovi stranica gdje osobe mogu izraziti svoje stavove: društvene mreže, portali, blogovi, forumi i slično. Međutim, zbog prevelike količine dostupnih podataka teško je dobiti jasno izražene stavove i mišljenja kako pojedinaca tako i ciljanih skupina. Jedan od osnovnih problema predstavlja broj različitih izvora koji sadrže mišljenja što može otežati ljudima traženje onih relevantnih. Što dovodi do sve veća potrebe za automatskim otkrivanjem mišljenja, odnosno analizom sentimenta. Ova vrsta analize postaje sve popularnija u mnogim domenama: politici, zdravstvu, proizvodnji potrošačkih proizvoda, raznim uslugama i slično. Jedan od osnovnih zadataka analize sentimenta je klasifikacija prema polaritetu, odnosno odvajanje tekstova koji sadrže sentiment u tri kategorije: pozitivnu, negativnu i neutralnu. Ovaj rad obuhvaća teoretski dio u kojem su opisani i objašnjeni glavni pojmovi analize sentimenta te istraživački dio koji se bazira na analizi komentara s portala Index i Jutarnji list te mikroblogova vezanih uz temu izbjegličke krize. Analiza je podijeljena u dva dijela: u prvom dijelu je izrađena frekvencijska analiza riječi u rečenici te je izrađen program koji uči i testira klasifikator pomoću pripremljenog korpusa. U rezultatima je dobiveno da su najčešće korištene riječi u komentarima: „bravo“, „čovjek“, „izbjeglica“ i „eu“ , te da klasifikator maksimalne entropije ima najveći postotak točnosti za ovaj korpus. Drugi dio analize se sastoji od usporedbe korištenog vokabulara i ukupnog sentimenta dva skupa podataka koji su prikupljeni u dva različita vremenska perioda. Rezultati su prikazani u obliku histograma i tablica, a program je napisan u programskom jeziku Python. Cilj rada je analizirati podatke i zaključiti koji su stav ljudi imaju u vezi izbjeglica te vidjeti postoji li razlika u stavu kroz određeni vremenski period.

analiza sentimenta, Twitter, klasifikacija, polaritet

nije evidentirano

engleski

Sentiment Analysis of Texts and Tweets Related to War and Immigrant Crises

nije evidentirano

sentiment analysis, Twitter, classification, polarity

nije evidentirano

Podaci o izdanju

60

12.09.2018.

obranjeno

Podaci o ustanovi koja je dodijelila akademski stupanj

Rijeka

Povezanost rada

Informacijske i komunikacijske znanosti, Računarstvo