PREPOZNAVANJE GOVORA U STVARNOM VREMENU POMOĆU FPGA (CROSBI ID 409602)
Ocjenski rad | diplomski rad
Podaci o odgovornosti
Labak, Matija
Hocenski, Željko
Matić, Tomislav
hrvatski
PREPOZNAVANJE GOVORA U STVARNOM VREMENU POMOĆU FPGA
U ovom radu je dan pregled povijesti razvitka sustava za prepoznavanje govora. Opisani su osnovni algoritmi koje sustavi za prepoznavanje govora koriste. Objašnjeno je što su to značajke govornog signala te kako se stvaraju. Sustavi za prepoznavanje govora koriste algoritme odabira jezičnih jedinica. Dinamičko savijanje vremena je algoritam u kojem se govorni signal uspoređuje s drugim govornim signalom dinamičkim savijanjem značajki signala po vremenskoj osi. Umjetne neuronske mreže su alat koji se primjenjuje na problem pretraživanja uzoraka, pa tako i na problem prepoznavanja govora. Skriveni Markovljevi modeli uspješno modeliraju razne jezične jedinice te su jedan od najčešćih algoritama koje se koriste u sustavima za prepoznavanje govora. Dubinske neuronske mreže se koriste u sustavima s velikim zahtjevima. Za implementaciju je korišten Altium NanoBoard 3000 sustav koji je razvijan u programu Altium Designer. Razvijen je ugrađeni računalni sustav koji se temelji na TSK3000A procesoru, a uključuje audio jedinicu koja služi za unos zvuka s audio ulaza ploče. Sustav koji je implementiran se temelji na linearno prediktivnoj analizi. Linearno preditkivnom analizom nastaju LPC koeficijenti koji u konačnici služe za usporedbu s usrednjenim značajkama u sustavu za prepoznavanju glasova hrvatskog jezika. Provedeno je testiranje napravljenog sustava za prepoznavanje glasova hrvatskog jezika. Točnost sustava za cjelokupno proveden eksperiment iznosi 44%. Za snimke po kojima su napravljene referente usrednjene značajke sustava točnost iznosi 93%. Mjerenje vremena proračuna značajki je potvrdilo da sustav u trenutnom stanju ne može ispuniti vremenski zahtjev sustava za proračunom u stvarnom vremenu
automatsko prepoznavanje govora, Altium NanoBoard, FPGA, značajke signala govora, linerano preditkivna analiza, glasovi hrvatskog jezika
nije evidentirano
engleski
The voice recognition in real time using FPGA
nije evidentirano
automatic speech recognition, Altium NanoBoard, FPGA, voice signal features, linear predictive analysis, Croatian phones
nije evidentirano
Podaci o izdanju
80
29.09.2016.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike, računarstva i informacijskih tehnologija Osijek
Osijek