Pristupi izradi strojnog tezaurusa za hrvatski jezik (CROSBI ID 349049)
Ocjenski rad | doktorska disertacija
Podaci o odgovornosti
Mikelić Preradović, Nives
Boras, Damir
hrvatski
Pristupi izradi strojnog tezaurusa za hrvatski jezik
Ova disertacija bavi se dvama problemima, od kojih prvi predstavlja moguće početke razvoja sustava pretvorbe teksta u govor za hrvatski jezik kroz izradu naglasno-izgovornog leksikona glagola, imenica i pridjeva. Na temelju naglasno- sklonidbenih modela imenica i pridjeva te naglasno-konjugacijskih modela glagola definiranih u ovom radu, razvijen je alat koji automatski generira naglasne oblike riječi u svim padežima, odnosno licima, uzimajući njihov osnovni oblik iz leksičke baze i pridružujući im valjane paradigmatske nastavke i naglaske. Ako se ovaj alat bude implementirao kao dio naglasnog izgovornog leksikona u hrvatskom sustavu pretvorbe teksta u govor, izgovor leksema će se moći generirati automatski za riječi koje se nalaze u leksičkoj bazi, uz pomoć pravila pretvorbe grafema u foneme. Drugi problem kojim se bavi ovaj rad je izrada valencijskog leksikona hrvatskih glagola – CROVALLEX-a. Verzija 2.008 sadrži 1739 glagola s 5118 valencijskih okvira (što je u prosjeku 3 valencijska okvira po glagolu) te 173 sintaktičko- semantičke klase. Pri njegovom stvaranju vodilo se računa o čitljivosti i dostupnosti, lakoj orijentaciji i razumljivosti. Osnovni ciljevi izrade ovog leksikona su unapređivanje opće jezične kulture te upotrebnog naglasnog i općejezičnog standarda hrvatskoga jezika kroz jednostavni i intuitivni pristup širokom rasponu informacija rječničkog tipa. No, cilj izrade ovog leksikona također je bio i napraviti modul za automatsku obradu tekstova na hrvatskom jeziku. CROVALLEX valencijski leksikon bi svoj doprinos prvenstveno mogao pokazati u automatskoj sintaktičkoj analizi, ako se uklopi u automatski sustav za stvaranje prikaza rečenica hrvatskog jezika uz pomoć tektogramatičkog parsera.
valencijski leksikon; naglasno-sklonidbeni modela imenica i pridjeva; naglasno-konjugacijski model glagola; naglasno morfološki analizator i generator; dubinski padeži; sustav za pretvorbu teksta u govor; sintaktičko-semantičke klase; valencijski okvir
nije evidentirano
engleski
Approaches to the Development of the Machine Lexicon for Croatian Language
nije evidentirano
valence lexicon; accentual conjugational paradigm of verbs; accentual declensional paradigm of nouns; accentual declensional paradigm of adjectives;
nije evidentirano
Podaci o izdanju
470
01.04.2008.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Filozofski fakultet u Zagrebu
Zagreb, Hrvatska