Identifikacija osoba i poslovnih subjekata u tekstualnim dokumentima temeljem leksičke analize i sustava bodovanja (CROSBI ID 370564)
Ocjenski rad | magistarski rad (mr. sc. i mr. art.)
Podaci o odgovornosti
Lončar, Goran
Bogunović, Nikola
Bogunović, Nikola
hrvatski
Identifikacija osoba i poslovnih subjekata u tekstualnim dokumentima temeljem leksičke analize i sustava bodovanja
Sve veći broj medija prisutan je na Internetu, a time se povećava i količina podataka koja nam je dostupna. Poslovnim korisnicima najzanimljiviji su mediji koji objavljuju informacije vezane uz njihovo poslovno okruženje te informacije koje bi im mogle pomoći u njihovom poslovanju. U ogromnoj količini vijesti i podataka koja se svaki dan objavljuje sve je teže i sporije pronaći informacije korisne poslovnim korisnicima. Sustav koji bi identificirao poslovne subjekte i osobe u vijestima omogućio bi izradu proizvoda koji bi poslovnim korisnicima olakšali pronalaženje točne informacije. U ovom magistarskom radu predstavljen je sustav koji na temelju leksičke analize tekstnog dokumenta i posebno osmišljenog sustava bodovanja omogućava označavanje i identifikaciju subjekata i osoba. U radu su analizirani problemi prepoznavanja naziva i identifikacije te unapređenjem postojećih istraživanja na tom području ponuđena su rješenja. Sustav je primijenjen na vijesti Internet izdanja poslovnih dnevnika i tjednika te je postignuta F-mjera identifikacije 86%.
dubinska analiza teksta; leksička analiza; identifikacija osoba; identifikacija poslovnih subjekata
nije evidentirano
engleski
Identification of persons and business subjects in text documents based on lexical analysis and scoring system
nije evidentirano
text mining; lexical analysis; identification of persons; identification of business subjects
nije evidentirano
Podaci o izdanju
87
07.12.2011.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb