Nalazite se na CroRIS probnoj okolini. Ovdje evidentirani podaci neće biti pohranjeni u Informacijskom sustavu znanosti RH. Ako je ovo greška, CroRIS produkcijskoj okolini moguće je pristupi putem poveznice www.croris.hr
izvor podataka: crosbi !

PREPOZNAVANJE GOVORA U STVARNOM VREMENU POMOĆU FPGA (CROSBI ID 409602)

Ocjenski rad | diplomski rad

Labak, Matija PREPOZNAVANJE GOVORA U STVARNOM VREMENU POMOĆU FPGA / Hocenski, Željko (mentor); Matić, Tomislav (neposredni voditelj). Osijek, Fakultet elektrotehnike, računarstva i informacijskih tehnologija Osijek, . 2016

Podaci o odgovornosti

Labak, Matija

Hocenski, Željko

Matić, Tomislav

hrvatski

PREPOZNAVANJE GOVORA U STVARNOM VREMENU POMOĆU FPGA

U ovom radu je dan pregled povijesti razvitka sustava za prepoznavanje govora. Opisani su osnovni algoritmi koje sustavi za prepoznavanje govora koriste. Objašnjeno je što su to značajke govornog signala te kako se stvaraju. Sustavi za prepoznavanje govora koriste algoritme odabira jezičnih jedinica. Dinamičko savijanje vremena je algoritam u kojem se govorni signal uspoređuje s drugim govornim signalom dinamičkim savijanjem značajki signala po vremenskoj osi. Umjetne neuronske mreže su alat koji se primjenjuje na problem pretraživanja uzoraka, pa tako i na problem prepoznavanja govora. Skriveni Markovljevi modeli uspješno modeliraju razne jezične jedinice te su jedan od najčešćih algoritama koje se koriste u sustavima za prepoznavanje govora. Dubinske neuronske mreže se koriste u sustavima s velikim zahtjevima. Za implementaciju je korišten Altium NanoBoard 3000 sustav koji je razvijan u programu Altium Designer. Razvijen je ugrađeni računalni sustav koji se temelji na TSK3000A procesoru, a uključuje audio jedinicu koja služi za unos zvuka s audio ulaza ploče. Sustav koji je implementiran se temelji na linearno prediktivnoj analizi. Linearno preditkivnom analizom nastaju LPC koeficijenti koji u konačnici služe za usporedbu s usrednjenim značajkama u sustavu za prepoznavanju glasova hrvatskog jezika. Provedeno je testiranje napravljenog sustava za prepoznavanje glasova hrvatskog jezika. Točnost sustava za cjelokupno proveden eksperiment iznosi 44%. Za snimke po kojima su napravljene referente usrednjene značajke sustava točnost iznosi 93%. Mjerenje vremena proračuna značajki je potvrdilo da sustav u trenutnom stanju ne može ispuniti vremenski zahtjev sustava za proračunom u stvarnom vremenu

automatsko prepoznavanje govora, Altium NanoBoard, FPGA, značajke signala govora, linerano preditkivna analiza, glasovi hrvatskog jezika

nije evidentirano

engleski

The voice recognition in real time using FPGA

nije evidentirano

automatic speech recognition, Altium NanoBoard, FPGA, voice signal features, linear predictive analysis, Croatian phones

nije evidentirano

Podaci o izdanju

80

29.09.2016.

obranjeno

Podaci o ustanovi koja je dodijelila akademski stupanj

Fakultet elektrotehnike, računarstva i informacijskih tehnologija Osijek

Osijek

Povezanost rada

Elektrotehnika