crta
Hrvatska znanstvena Sekcija img
bibliografija
3 gif
 Naslovna
 O projektu
 FAQ
 Kontakt
4 gif
Pregledavanje radova
Jednostavno pretraživanje
Napredno pretraživanje
Skupni podaci
Upis novih radova
Upute
Ispravci prijavljenih radova
Ostale bibliografije
Slični projekti
 Bibliografske baze podataka

Pregled bibliografske jedinice broj: 199890

Zbornik radova

Autori: Šarić, Frane; Šnajder, Jan; Dalbelo Bašić, Bojana; Eklić, Hrvoje
Naslov: Enhanced Thesaurus Terms Extraction for Document Indexing
Izvornik: Proceedingss of the 27th International Conference on Information Technology Interfaces : ITI 2005 / Lužar - Stiffler, Vesna ; Hljuz Dobrić, Vesna (ur.). - Zagreb : SRCE University Computing Centre, University of Zagreb , 2005. 227-232.
Skup: International Conference on Information Technology Interfaces (27 ; 2005)
Mjesto i datum: Cavtat, Hrvatska, 20-23.06.2005.
Ključne riječi: Information retrieval; term extraction; NLP; lemmatisation; Eurovoc
Sažetak:
In this paper we present an enhanced method for the thesaurus term extraction regarded as the main support to a semi-automatic indexing system. The enhancement is achieved by neutralising the efect of language morphology applying lemmatisation on both the text and the thesaurus, and by implementing an effcient recursive algorithm for term extraction. Formal definition and statistical evaluation of the experimental results of the proposed method for thesaurus term extraction are given. The need for disambiguation methods and the efect of lemmatisation in the realm of thesaurus term extraction are discussed.
Vrsta sudjelovanja: Predavanje
Vrsta prezentacije u zborniku: Ostalo
Vrsta recenzije: Međunarodna recenzija
Izvorni jezik: ENG
Kategorija: Znanstveni
Znanstvena područja:
Računarstvo
Puni text rada: 199890.9-149-saric.pdf



  Verzija za printanje   za tiskati


upomoc
foot_4