crta
Hrvatska znanstvena Sekcija img
bibliografija
3 gif
 Naslovna
 O projektu
 FAQ
 Kontakt
4 gif
Pregledavanje radova
Jednostavno pretraživanje
Napredno pretraživanje
Skupni podaci
Upis novih radova
Upute
Ispravci prijavljenih radova
Ostale bibliografije
Slični projekti
 Bibliografske baze podataka

Pregled bibliografske jedinice broj: 826982

Zbornik radova

Autori: Turkalj, Lucija
Naslov: O pretvorbi kartičnoga mjesnoga kataloga Rječnika crkvenoslavenskoga jezika hrvatske redakcije u strojno čitljiv oblik
( On the conversion of the Source-card catalog of the Dictionary of the Croatian Redaction of Church Slavonic into a Machine-Readable Form )
Izvornik: Crkvenoslavenska i hrvatska povijesna leksikografija. Međunarodni znanstveno-stručni skup, Zagreb 29. lipnja - 1. srpnja 2016. Knjižica sažetakaStaroslavenski institut, 2016. / Kovačević, Ana ; Vukoja, Vida (ur.). - Zagreb : Staroslavenski institut , 2016. 70-71 (ISBN: 978-953-6080-22-9).
Skup: Crkvenoslavenska i hrvatska povijesna leksikografija
Mjesto i datum: Zagreb, Hrvatska, 29.06.-01.07. 2016.
Ključne riječi: hrvatski crkvenoslavenski jezik; korpus Rječnika crkvenoslavenskoga jezika hrvatske redakcije; mjesni katalog; dohvaćanje podataka; prepoznavanje rukom pisanoga teksta
( Croatian Church Slavonic language; corpus of the Dictionary of The Croatian Redaction of Church Slavonic; source-card catalog; data capture; ICR recognition )
Sažetak:
U izlaganju se opisuje pretvorba skeniranih slika mjesnoga kataloga korpusa Rječnika crkvenoslavenskoga jezika hrvatske redakcije u strojno čitljiv oblik. Prepoznavanje rukom pisanoga teksta (ICR) provedeno je računalnim programom za automatsku obradu rukom pisanih stukturiranih obrazaca. Grafički poboljšane, slike su uvezene, povezane u manje jedinice vezane kontekstom i položajem u izvoru te podudarene s pripadajućim dokumentnim definicijama koje defi niraju principe identifi kacije i procesiranja dokumenata i pružaju mogućnosti poput odabira skupova znakova i dodavanja rječničkih popisa. U prepoznavanju teks tova dokumenata posebna pozornost posvećena je: glavnim oblicima crkvenoslavenskoga teksta i crkvenoslavenskim pojavnicama, u tekstovnom i lematiziranom obliku, pisanima ćiriličnim pismom, s pripadajućim gramatičkim oznakama i podatcima o tekstovnom mjestu, pisanima latinicom. Tekstovi grčkih i latinskih paralela i njihovi oblici riječi te podatci o njihovom mjestu, teže strojno čitljivi zbog spojenoga kurzivnoga pisanja dodani su ručno, u obliku potvrđenom u pouzdanim tiskanim ili elektronskim izdanjima. Prepoznat i provjeren strojno čitljiv tekst mjesnoga kataloga izvezen je u XML formatu, s očuvanim informacijama vezanim za strukturu i opis podataka.
Vrsta sudjelovanja: Predavanje
Vrsta prezentacije u zborniku: Sažetak
Vrsta recenzije: Nema recenziju
Projekt / tema: HRZZ-UIP-2013-11-2462
Izvorni jezik: HRV
Kategorija: Stručni
Upisao u CROSBI: Lucija Turkalj (lucija.turkalj@stin.hr), 13. Srp. 2016. u 13:50 sati



Verzija za printanje   za tiskati


upomoc
foot_4