crta
Hrvatska znanstvena Sekcija img
bibliografija
3 gif
 Naslovna
 O projektu
 FAQ
 Kontakt
4 gif
Pregledavanje radova
Jednostavno pretraživanje
Napredno pretraživanje
Skupni podaci
Upis novih radova
Upute
Ispravci prijavljenih radova
Ostale bibliografije
Slični projekti
 Bibliografske baze podataka

Pregled bibliografske jedinice broj: 864699

Disertacija

Autor: Labak, Matija
Naslov: PREPOZNAVANJE GOVORA U STVARNOM VREMENU POMOĆU FPGA
( The voice recognition in real time using FPGA )
Vrsta: završni rad - diplomski/integralni studij
Fakultet: Fakultet elektrotehnike, računarstva i informacijskih tehnologija Osijek
Sveučilište: Sveučilište J.J. Strossmayera u Osijeku
Mjesto: Osijek
Datum: 29.09.
Godina: 2016
Stranica: 80
Mentor: Hocenski, Željko
Neposredni voditelj: Matić, Tomislav
Ključne riječi: automatsko prepoznavanje govora, Altium NanoBoard, FPGA, značajke signala govora, linerano preditkivna analiza, glasovi hrvatskog jezika
( automatic speech recognition, Altium NanoBoard, FPGA, voice signal features, linear predictive analysis, Croatian phones )
Sažetak:
U ovom radu je dan pregled povijesti razvitka sustava za prepoznavanje govora. Opisani su osnovni algoritmi koje sustavi za prepoznavanje govora koriste. Objašnjeno je što su to značajke govornog signala te kako se stvaraju. Sustavi za prepoznavanje govora koriste algoritme odabira jezičnih jedinica. Dinamičko savijanje vremena je algoritam u kojem se govorni signal uspoređuje s drugim govornim signalom dinamičkim savijanjem značajki signala po vremenskoj osi. Umjetne neuronske mreže su alat koji se primjenjuje na problem pretraživanja uzoraka, pa tako i na problem prepoznavanja govora. Skriveni Markovljevi modeli uspješno modeliraju razne jezične jedinice te su jedan od najčešćih algoritama koje se koriste u sustavima za prepoznavanje govora. Dubinske neuronske mreže se koriste u sustavima s velikim zahtjevima. Za implementaciju je korišten Altium NanoBoard 3000 sustav koji je razvijan u programu Altium Designer. Razvijen je ugrađeni računalni sustav koji se temelji na TSK3000A procesoru, a uključuje audio jedinicu koja služi za unos zvuka s audio ulaza ploče. Sustav koji je implementiran se temelji na linearno prediktivnoj analizi. Linearno preditkivnom analizom nastaju LPC koeficijenti koji u konačnici služe za usporedbu s usrednjenim značajkama u sustavu za prepoznavanju glasova hrvatskog jezika. Provedeno je testiranje napravljenog sustava za prepoznavanje glasova hrvatskog jezika. Točnost sustava za cjelokupno proveden eksperiment iznosi 44%. Za snimke po kojima su napravljene referente usrednjene značajke sustava točnost iznosi 93%. Mjerenje vremena proračuna značajki je potvrdilo da sustav u trenutnom stanju ne može ispuniti vremenski zahtjev sustava za proračunom u stvarnom vremenu
Izvorni jezik: hrv
Znanstvena područja:
Elektrotehnika
Upisao u CROSBI: Željko Hocenski (Zeljko.Hocenski@etfos.hr), 6. Ožu. 2017. u 18:15 sati



Verzija za printanje   za tiskati


upomoc
foot_4