Parsing Croatian and Serbian by Using Croatian Dependency Treebanks

Agić, Željko; Merkler, Danijela; Berović, Daša

izvor podataka: crosbi !

Parsing Croatian and Serbian by Using Croatian Dependency Treebanks (CROSBI ID 600123)

Prilog sa skupa u zborniku | izvorni znanstveni rad | međunarodna recenzija

Agić, Željko ; Merkler, Danijela ; Berović, Daša Parsing Croatian and Serbian by Using Croatian Dependency Treebanks // Proceedings of the Fourth Workshop on Statistical Parsing of Morphologically Rich Languages (SPMRL 2013). Seattle (WA): Association for Computational Linguistics (ACL), 2013. str. 22-33

Podaci o odgovornosti

Autori

Agić, Željko ; Merkler, Danijela ; Berović, Daša

Osnovni podaci na izvornom jeziku
Osnovni podaci na ostalim jezicima

Jezik

engleski

Naslov

Parsing Croatian and Serbian by Using Croatian Dependency Treebanks

Sažetak

We investigate statistical dependency parsing of two closely related languages, Croatian and Serbian. As these two morphologically complex languages of relaxed word order are generally under- resourced -- with the topic of dependency parsing still largely unaddressed, especially for Serbian -- we make use of the two available dependency treebanks of Croatian to produce state-of- the-art parsing models for both languages. We observe parsing accuracy on four test sets from two domains. We give insight into overall parser performance for Croatian and Serbian, impact of preprocessing for lemmas and morphosyntactic tags and influence of selected morphosyntactic features on parsing accuracy.

Ključne riječi

dependency treebank; dependency parsing; Croatian; Serbian

Napomena

nije evidentirano

Jezik

nije evidentirano

Naslov

nije evidentirano

Sažetak

nije evidentirano

Ključne riječi

nije evidentirano

Napomena

nije evidentirano

Podaci o prilogu

Stranice rada

22-33.

Godina izdavanja

2013.

Status objave rada

objavljeno

Podaci o matičnoj publikaciji

Naslov

Proceedings of the Fourth Workshop on Statistical Parsing of Morphologically Rich Languages (SPMRL 2013)

Izdavač

Seattle (WA): Association for Computational Linguistics (ACL)

ISBN

978-1-937284-97-8

Podaci o skupu

Skup

Fourth Workshop on Statistical Parsing of Morphologically Rich Languages (SPMRL 2013)

Vrsta sudjelovanja

predavanje

Datum održavanja skupa

18.10.2013-21.10.2013

Mjesto održavanja skupa

Seattle (WA), Sjedinjene Američke Države

Povezanost rada

Povezane osobe

Željko Agić (CroRIS ID: 27179; MBZ: 291312) (autor/i)

Daša Farkaš (CroRIS ID: 44291; MBZ: 400932) (autor/i)

Povezane ustanove

Filozofski fakultet u Zagrebu (130) (autorova ustanova)

Povezani projekti

Računalna sintaksa hrvatskoga jezika (rezultat rada na projektu)

Područje

Informacijske i komunikacijske znanosti

Poveznice

aclweb.org