Mjere udaljenosti u obradi govornog signala (CROSBI ID 381655)
Ocjenski rad | sveučilišni preddiplomski završni rad
Podaci o odgovornosti
Rendulić, Ivor
Petrinović, Davor
hrvatski
Mjere udaljenosti u obradi govornog signala
Objektivno određivanje sličnosti dvaju govornih signala vrlo je složen problem. Kako bi se pronašla matematička udaljenost koja približno odgovara subjektivnom dojmu ljudskog uha potrebno je pronaći i usporediti samo fonetski značajne parametre govora. Korištenje spektra govornog signala u mjerenju udaljenosti daje loše rezultate jer, osim fonetski značajne prijenosne funkcije vokalnog trakta, spektar uključuje i pobudni signal koji unosi neželjenu i fonetski beznačajnu informaciju. U svrhu odvajanja prijenosne funkcije vokalnog trakta od signala pobude učinkovitima su se pokazali all-pole modeliranje govora pomoću linearnog prediktivnog kodiranja te kepstralna reprezentacija govora. S obzirom na logaritamsku percepciju glasnoće zvuka kod ljudi, logično je i da se većina učinkovitih mjera udaljenosti temelji na razlikama kepstara ili logaritama spektara govornih signala. Neke od najčešće korištenih simetričnih mjera su udaljenosti logaritama spektara, kepstralna udaljenost i težinska kepstralna udaljenost. Druga porodica mjera udaljenosti temelji se na vjerodostojnosti i uključuje Itakura-Saito mjeru udaljenosti, COSH mjeru udaljenosti, Itakurinu mjeru udaljenosti te mjeru udaljenosti temeljenu na omjeru vjerodostojnosti.
govor; udaljenost; LPC; kepstar; Itakura
nije evidentirano
engleski
Distance measures in speech processing
nije evidentirano
speech; distance; LPC; cepstrum; Itakura
nije evidentirano
Podaci o izdanju
59
27.06.2011.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb