Ekstrakcija ključnih riječi iz tekstova na talijanskome jeziku (CROSBI ID 421893)
Ocjenski rad | diplomski rad
Podaci o odgovornosti
Pokos, Marija
Martinčić-Ipšić, Sanda
hrvatski
Ekstrakcija ključnih riječi iz tekstova na talijanskome jeziku
Ekstrakcija ključnih riječi je metoda kojom se automatski identificira skup izraza koji najbolje opisuju dokument. Cilj ovog rada je istražiti sustave za ekstrakciju ključnih riječi te predstaviti rad algoritma RAKE i algoritma Maui. U uvodnom dijelu rada objasnit će se teorijski dio o ekstrakciji ključnih riječi, lingvističko stajalište te procesi lematizacije i korjenovanja. Time će se dobiti podloga za daljnje istraživanje. Kako bi se pobliže objasnili algoritmi, testirat će ih se na vlastitome skupu podataka. Radi se o novinskim tekstovima umjetničkog sadržaja prevedenim na talijanski jezik. Skup podataka na kojim se radi testiranje još su i stop riječi (engl. stopwords) talijanskog jezika i ključne riječi označene od strane čovjeka. Nakon analize algoritama objašnjeno je i prikazano vrednovanje postupaka pomoću uobičajenih mjera u postupcima ekstrakcije ključnih riječi, odnosno pomoću mjera precision, recall i F1. Rezultati pokazuju da ključne riječi koje je označio algoritam Maui imaju više sličnosti s ključnim riječima koje je označio čovjek. Ključne riječi koje je označio algoritam RAKE, također imaju sličnosti, no u manjoj mjeri.
Ekstrakcija ključnih riječi, ključne riječi, RAKE, Maui
nije evidentirano
engleski
Keyword Extraction from Italian Texts
nije evidentirano
Keyword extraction, keywords, RAKE, Maui
nije evidentirano
Podaci o izdanju
48
21.09.2018.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Rijeka