crta
Hrvatska znanstvena Sekcija img
bibliografija
3 gif
 Naslovna
 O projektu
 FAQ
 Kontakt
4 gif
Pregledavanje radova
Jednostavno pretraživanje
Napredno pretraživanje
Skupni podaci
Upis novih radova
Upute
Ispravci prijavljenih radova
Ostale bibliografije
Slični projekti
 Bibliografske baze podataka

Pregled bibliografske jedinice broj: 607634

Zbornik radova

Autori: Beliga, Slobodan; Pobar, Miran; Martinčić-Ipšić, Sanda
Naslov: Normalization of Non-Standard Words in Croatian Texts
Izvornik: Text, Speech and Dialogue extension to Lecture Notes in Artificial Intelligence LNAI6836 / Hebernal, Ivan ; Matoušek, Vaclav (ur.). - Plzen : University of West Bohemia , 2011. 1-8 (ISBN: 987-80-261-0069-0).
Skup: Text, Speech and Dialogue
Mjesto i datum: Plzen, Czech Republic, 1-5.9.2011
Ključne riječi: text normalization; non-standard words; text-to-speech
Sažetak:
This paper presents text normalization which is an integral part of any text-to-speech synthesis system. Text normalization is a set of methods with a task to write non-standard words, like numbers, dates, times, abbreviations, acronyms and the most common symbols, in their full expanded form. The whole taxonomy for classification of non-standard words in Croatian language together with rule-based normalization methods combined with a lookup dictionary are proposed. Achieved token rate for normalization of Croatian texts is 95%, where 80% of expanded words are in correct morphological form.
Vrsta sudjelovanja: Predavanje
Vrsta prezentacije u zborniku: Cjeloviti rad (više od 1500 riječi)
Vrsta recenzije: Međunarodna recenzija
Projekt / tema: 318-0361935-0852
Izvorni jezik: ENG
Kategorija: Znanstveni
Znanstvena područja:
Računarstvo,Informacijske i komunikacijske znanosti
Upisao u CROSBI: smarti@uniri.hr (smarti@uniri.hr), 13. Pro. 2012. u 09:19 sati
Napomene:
Student Section



Verzija za printanje   za tiskati


upomoc
foot_4