crta
Hrvatska znanstvena Sekcija img
bibliografija
3 gif
 Naslovna
 O projektu
 FAQ
 Kontakt
4 gif
Pregledavanje radova
Jednostavno pretraživanje
Napredno pretraživanje
Skupni podaci
Upis novih radova
Upute
Ispravci prijavljenih radova
Ostale bibliografije
Slični projekti
 Bibliografske baze podataka

Pregled bibliografske jedinice broj: 69625

Časopis

Autori: Tadić, Marko
Naslov: Računalna obradba hrvatskih korpusa: povijest, stanje i perspektive
( Croatian Corpus Processing: History, State of the Art and Perspectives )
Izvornik: Suvremena lingvistika (0586-0296) 23 (1997), 43-44; 387-394
Vrsta rada: članak
Ključne riječi: korpusna lingvistika; korpus; hrvatski jezik
( corpus linguistics; corpus; Croatian language )
Sažetak:
Članak daje pregled obradbe hrvatskih korpusa. Navode se najznačajniji korpusni projekti od prvoga hrvatskoga računalno podržanoga korpusa - Gundulićev Osman (Bujas 1967), preko Moguševa milijunskoga korpusa do današnjih dana. Nadalje se rad usredotočuje na Hrvatski nacionalni korpus koji je središnji projekt na području korpusne lingvistike u Hrvatskoj danas. Hrvatski nacionalni korpus (Tadić 1996) čine dvije sastavnice: 1) reprezentativni 30-milijunski korpus suvremenoga hrvatskoga jezika (30M) i 2) Hrvatski elektronski tekstovni arhiv (HETA). U prvoj fazi sastavljanja Hrvatskoga nacionalnoga korpusa naglasak je na zaokruživanju 30-milijunskoga korpusa dok će se u drugoj fazi sav napor preusmjeriti na širenje obuhvata Hrvatskoga elektronskog tekstovnoga arhiva. U sadašnjem stanju rad na 30-milijunski korpusu, koji bi trebao biti završen 2000, u fazi je uznapredovala planiranja i javnoga testiranja probne inačice korpusa (7, 68 milijuna pojavnica) putem WWW-a.
Projekt / tema: 130718
Izvorni jezik: HRV
Kategorija: Stručni
Znanstvena područja:
Filologija
URL cjelovitog teksta:
Google Scholar: Računalna obradba hrvatskih korpusa: povijest, stanje i perspektive



  Verzija za printanje   za tiskati


upomoc
foot_4