Extracting most frequent Croatian root words using digram comparison and latent semantic analysis

Radoš, Zvonimir; Jović, Franjo; Job, Josip

izvor podataka: crosbi ✓

Extracting most frequent Croatian root words using digram comparison and latent semantic analysis (CROSBI ID 508073)

Prilog sa skupa u zborniku | izvorni znanstveni rad | međunarodna recenzija

Radoš, Zvonimir ; Jović, Franjo ; Job, Josip Extracting most frequent Croatian root words using digram comparison and latent semantic analysis // Proceedings of the 7th International Conference on Enterprise Information Systems (ICEIS 2005) : proceedings. 2005. str. 370-373

Podaci o odgovornosti

Autori

Radoš, Zvonimir ; Jović, Franjo ; Job, Josip

Osnovni podaci na izvornom jeziku
Osnovni podaci na ostalim jezicima

Jezik

engleski

Naslov

Extracting most frequent Croatian root words using digram comparison and latent semantic analysis

Sažetak

A method for extracting root words from Croatian language text is presented. The described method is knowledge-free and can be applied to any language. Morphological and semantic aspects of the language were used. The algorithm creates morph-semantic groups of words and extract common root for every group. For morphological grouping we use digram comparison to group words depending on their morphological similarity. Latent semantic analysis is applied to split morphological groups into semantic subgroups of words. Root words are extracted from every morpho-semantic group. When applied to Croatian language text, among hundred most frequent root words, produced by this algorithm, there were 60 grammatically correct ones and 25 FAP (for all practical purposes) correct root words.

Ključne riječi

morphological analysis; LSA; word tree; stem; root word; knowledge-free

Napomena

ISBN 972-8865-19-8

Jezik

nije evidentirano

Naslov

nije evidentirano

Sažetak

nije evidentirano

Ključne riječi

nije evidentirano

Napomena

nije evidentirano

Podaci o prilogu

Stranice rada

370-373.

Godina izdavanja

2005.

Status objave rada

objavljeno

Podaci o matičnoj publikaciji

Naslov

Proceedings of the 7th International Conference on Enterprise Information Systems (ICEIS 2005) : proceedings

Podaci o skupu

Skup

International Conference on Enterprise Information Systems (7 ; 2005)

Vrsta sudjelovanja

predavanje

Datum održavanja skupa

24.05.2005-28.05.2005

Mjesto održavanja skupa

Miami (FL), Sjedinjene Američke Države

Povezanost rada

Povezane osobe

Josip Job (autor/i)

Franjo Jović (autor/i)

Povezane ustanove

Fakultet elektrotehnike, računarstva i informacijskih tehnologija Osijek (165) (autorova ustanova)

Povezani projekti

Industrijski sustavi umjetne inteligencije (rezultat rada na projektu)

Područje

Elektrotehnika, Računarstvo, Filologija