Računalno oblikovanje korpusa starohrvatskoga jezika

Barbarić, Vuk-Tadija; Kapetanović, Amir

izvor podataka: crosbi !

Računalno oblikovanje korpusa starohrvatskoga jezika (CROSBI ID 178066)

Prilog u časopisu | pregledni rad (znanstveni) | međunarodna recenzija

Barbarić, Vuk-Tadija ; Kapetanović, Amir Računalno oblikovanje korpusa starohrvatskoga jezika // Filologija : časopis Razreda za filološke znanosti Hrvatske akademije znanosti i umjetnosti, 59 (2012), 1-13

Podaci o odgovornosti

Autori

Barbarić, Vuk-Tadija ; Kapetanović, Amir

Osnovni podaci na izvornom jeziku
Osnovni podaci na ostalim jezicima

Jezik

hrvatski

Naslov

Računalno oblikovanje korpusa starohrvatskoga jezika

Sažetak

Rad na projektu Starohrvatski rječnikobuhvaća tri glavne faze: tekstološku, računalnu i leksikografsku. Autori se u ovom prilogu bave računalnim oblikovanjem korpusa starohrvatskoga jezika, i to pronalaženjem što učinkovitijega načina kodiranja primarnih podataka i metapodataka za korisnike, ali u okviru realnih mogućnosti projekta.

Ključne riječi

starohrvatski jezik; korpus; standard TEI

Napomena

Research for the Old-Croatian Dictionary in the Department of Croatian Language History and Historical Lexicography at the Institute of Croatian Language and Linguistics consists of three main stages: textological, computational and lexicographic. The first stage (textological) is thoroughly explained in Kapetanović's article Digitization of Old Croatian Texts and Textual Criticism. This paper explains the second stage – computational corpus design for the mentioned dictionary. Therefore, the analysis is focused on anticipating problems in designing a computationally readable corpus of texts written in the Old Croatian language, and on providing possible solutions. The computational processing of the texts for the corpus is described, as are problems which arise from the selection of TEI and Philologic server application. Priorities in corpus design are determined in order to overcome the mentioned problems and other potential difficulties. One possible solution to the separation of the apparatus criticus from the Old Croatian texts is proposed. All proposals are aimed at a more efficient encoding of primary data and metadata with respect to users, while remaining within the cap

Jezik

engleski

Naslov

Computer Designed Corpus of the Old-Croatian Language

Sažetak

nije evidentirano

Ključne riječi

Old-Croatian language; corpus; TEI standard

Napomena

nije evidentirano

Podaci o izdanju

Časopis

Filologija : časopis Razreda za filološke znanosti Hrvatske akademije znanosti i umjetnosti

Volumen (broj)

Godina

2012.

Stranice rada

1-13

Status objave rada

objavljeno

ISSN

0449-363X

Povezanost rada

Povezane osobe

Amir Kapetanović (autor/i)

Vuk-Tadija Barbarić (autor/i)

Povezane ustanove

Institut za hrvatski jezik, Zagreb (212) (autorova ustanova)

Povezani projekti

Starohrvatski rječnik (rezultat rada na projektu)

Područje

Filologija

Poveznice

hrcak.srce.hr

Indeksiranost

Scopus