Vrednovanje lematizatora za hrvatski jezik (CROSBI ID 426841)
Ocjenski rad | sveučilišni preddiplomski završni rad
Podaci o odgovornosti
Matijević, Maja
Lauc, Tomislava
hrvatski
Vrednovanje lematizatora za hrvatski jezik
Lematizacija riječi u hrvatskome jeziku poseban je izazov zbog flektivnosti, brojnih gramatičkih kategorija te iznimaka od ionako odveć kompliciranih pravila. Uzmemo li u obzir činjenicu da ga zbog navedenoga na nekim razinama teško usavršavaju i izvorni govornici, nije teško zaključiti da ga stranci nerijetko uče duže nego ostale jezike, a iz toga se lako da zaključiti i da je implementacija bilo kakvoga računalnog sustava za hrvatski jezik složen zadatak. Svrha je ovoga rada vrednovanje sustava za lematizaciju tekstova na hrvatskome jeziku. Počevši od teorijskolingvističkoga opisa i usporedbe s ostalim vrstama jezikā preko problema višeznačnosti i homonimije, u radu će se izvesti zaključci o tipovima problema s kojima se lematizator susreo na stilski različitim tekstovima na hrvatskome jeziku – kako književnoumjetničkim, tako i razgovornim i novinskim tekstovima. Poseban naglasak bit će na analizi leksikona kao potencijalnoga izvora mogućih pogrešaka.
lematizacija ; evaluacija ; jezične tehnologije ; lematizator ; korjenovatelj
nije evidentirano
engleski
Evaluation of Lemmatizer for Croatian Language
nije evidentirano
lemmatisation ; evaluation ; Human Language Technologies ; lemmatizer ; stemmer
nije evidentirano
Podaci o izdanju
34
20.09.2016.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Filozofski fakultet u Zagrebu
Zagreb