Nalazite se na CroRIS probnoj okolini. Ovdje evidentirani podaci neće biti pohranjeni u Informacijskom sustavu znanosti RH. Ako je ovo greška, CroRIS produkcijskoj okolini moguće je pristupi putem poveznice www.croris.hr
izvor podataka: crosbi !

Language Processing Tools for German Language: The Distribution of Syllables in German Language (CROSBI ID 398257)

Ocjenski rad | sveučilišni preddiplomski završni rad

Babić, Nikola Language Processing Tools for German Language: The Distribution of Syllables in German Language / Martinčić - Ipšić, Sanda (mentor); Rijeka, . 2015

Podaci o odgovornosti

Babić, Nikola

Martinčić - Ipšić, Sanda

engleski

Language Processing Tools for German Language: The Distribution of Syllables in German Language

Jezični alati služe za detaljnu računalnu analizu prirodnog jezika, čije rezultate možemo iskoristiti u raznim istraživanjima. Moguća je analiza na temelju točno određenih elemenata koji se nalaze u prirodnom jeziku. Takvi alati su poznati pod nazivom „Natural Language Processing Tools“. Svrha ovog rada je prikazivanje aspekta rastavljanja slogova vezano uz pravila njemačkog jezika i provjera dobivenih rezultata istraživanja. Za provođenje statističke analize slogova korišten je korpus koji sadrži riječi iz pojednostavljenog njemačkog rječnika. Konačni rezultat programske analize se uspoređuje s postojećim rastavljenim slogovima riječi unutar njemačkog rječnika, što ukazuje na određene pogreške u slučaju prepuštanja programskog rastavljanja slogova. Rastavljanje na slogove je važan korak u problemu određivanja naglasaka riječi pri umjetnoj tvorbi govora. Boljim razumijevanjem prirodnog jezika smo korak bliže boljem razumijevanju nas samih, pošto je jezik proizvod ljudski bića. Uz pomoć programa za automatsko rastavljanje riječi na slogove bila je omogućena statistička analiza pojedinih detalja slogova unutar njemačkog jezika. Uspješno je analizirana učestalost broja slogova unutar svake riječi, duljina svakog pojedinog sloga i frekvencija pojavljivanja 16 modela sloga u svakoj riječi. Na kraju analize rezultata je ustanovljeno: • da su slogovi duljine tri slova najučestaliji (46%), te da slogovi većih duljina nisu zastupljeni u tolikoj mjeri (ukupno oko 20%) ; • da ima najviše riječi koje sadrže po četiri i pet različitih slogova (oko 40%) ; • da je najveći broj različitih slogova među slogovima sastavljenih od 5 riječi (oko 25%) • da je „CVC“ najzastupljeniji model sloga (44%) što odmah potvrđuje rezultate o slogovima duljine tri slova.

syllable; distribution of syllables; accent; pronunciation; phoneme; morpheme

nije evidentirano

nije evidentirano

nije evidentirano

nije evidentirano

nije evidentirano

nije evidentirano

Podaci o izdanju

24

22.09.2015.

obranjeno

Podaci o ustanovi koja je dodijelila akademski stupanj

Rijeka

Povezanost rada

Informacijske i komunikacijske znanosti