Nalazite se na CroRIS probnoj okolini. Ovdje evidentirani podaci neće biti pohranjeni u Informacijskom sustavu znanosti RH. Ako je ovo greška, CroRIS produkcijskoj okolini moguće je pristupi putem poveznice www.croris.hr
izvor podataka: crosbi !

Indeksiranje i pretraživanje tekstualnih podataka s gramatičkom podrškom (CROSBI ID 339841)

Ocjenski rad | magistarski rad (mr. sc. i mr. art.)

Krstinić, Damir Indeksiranje i pretraživanje tekstualnih podataka s gramatičkom podrškom / Slapničar, Ivan (mentor); Split, Fakultet elektrotehnike, strojarstva i brodogradnje u Splitu, . 2004

Podaci o odgovornosti

Krstinić, Damir

Slapničar, Ivan

hrvatski

Indeksiranje i pretraživanje tekstualnih podataka s gramatičkom podrškom

Razvoj digitalnih tehnologija i Interneta omogućava brzu razmjenu informacija. U okruženju u kojem je gotovo svaka informacija dostupna, problem postaje izdvajanje relevantnog znanja iz ogromne količine dostupnih podataka. Moderni sustavi za pretraživanje podataka bazirani su na principima vektorskog prostora. Dokumenti su prikazani kao vektori određeni terminima koji se u njima koriste, a pretraživanje se realizira po načelu geometrijske sličnosti. Većina ovih sustava orijentirana je na dokumente pisane engleskim jezikom čije je obilježje jednostavna gramatika sa malim brojem gramatičkih formi koje određena riječ može imati. U ovom radu razvijen je sustav za indeksiranje i pretraživanje digitalnih tekstualnih kolekcija baziran na principu vektorskog prostora i metodi latentnog semantičkog indeksiranja (LSI). LSI metoda reducira dimenziju matrice dokumenata i iskorištava semantičku strukturu jezika projiciranjem vektora na podprostor niže dimenzije. U sustav je implementirana podrška za gramatiku jezika čime su poboljšane performanse sustava kod pretraživanja kolekcija pisanih jezikom sa složenom gramatikom, kakav je i hrvatski jezik. U okviru rada razvijena je računalna implementacija gramatičkih pravila hrvatskog jezika.

WWW; Internet; prikupljanje informacija; pretraživanje teksta; vektorski prostori; latentno semantičko indeksiranje; LSI; rastav na singularne vrijednosti; SVD; gramatika; web spider

nije evidentirano

engleski

Indexing and Search of Textual Data with Grammar Support

nije evidentirano

WWW; Internet; information retrieval; text search; vector spaaces; latent semantic indexing; LSI; singular value decomposition; SVD; grammar; web spider

nije evidentirano

Podaci o izdanju

128

24.06.2004.

obranjeno

Podaci o ustanovi koja je dodijelila akademski stupanj

Fakultet elektrotehnike, strojarstva i brodogradnje u Splitu

Split

Povezanost rada

Povezane osobe



Matematika