Nalazite se na CroRIS probnoj okolini. Ovdje evidentirani podaci neće biti pohranjeni u Informacijskom sustavu znanosti RH. Ako je ovo greška, CroRIS produkcijskoj okolini moguće je pristupi putem poveznice www.croris.hr
izvor podataka: crosbi !

Hijerarhijska analiza svojstava nizova znakova metodama znanstvenog računanja i statistike (CROSBI ID 403531)

Ocjenski rad | doktorska disertacija

Ugrina, Ivo Hijerarhijska analiza svojstava nizova znakova metodama znanstvenog računanja i statistike / Basrak, Bojan ; Grubišić, Luka (mentor); Zagreb, Prirodoslovno-matematički fakultet, Zagreb, . 2014

Podaci o odgovornosti

Ugrina, Ivo

Basrak, Bojan ; Grubišić, Luka

hrvatski

Hijerarhijska analiza svojstava nizova znakova metodama znanstvenog računanja i statistike

U prvom dijelu disertacije prezentira se rezultat o distribuciji broja palindroma predodređene duljine u nizovima znakova s naglaskom na DNA nizove. Izvedeni su uvjeti pod kojima distribucija broja palindroma asimptotski teži normalnoj distribuciji. Također, izvedena je ocjena pogreške aproksimacije normalnom distribucijom te je prikazan primjer primjene na stvarnom DNA nizu. U drugom dijelu disertacije prezentira se novi pristup modeliranju sličnosti nizova znakova pomoću Markovljevih lanaca. Prikazan je model čija je motivacija ponajprije bila modeliranje pisanja poštanskih adresa u Hrvatskoj. No, model je upotrebljiv i na drugim problemima u različitim jezicima. U trećem dijelu disertacije prezentira se metoda prepoznavanja poštanskih adresa u slobodnom tekstu s naglaskom na dokumente s hrvatskih WWW stranica. Predložen je pristup putem metoda strojnog učenja. Izdvajaju se bitni prediktori te se prikazuju rezultati primjene na hrvatske WWW stranice. U četvrtom, krajnjem, dijelu disertacije proučava se kvaliteta metode izdvajanja dominantnih podgrupa iz podataka opisanih višedimenzionalnim atributima putem tenzorske CP dekompozicije i modificirane Thompsonove τ metode za prepoznavanje stršećih vrijednosti.

centralni granični teorem ; m-zavisni nizovi ; normalna distribucija ; palindromi u DNA ; sličnost nizova znakova ; poštanske adrese ; prepoznavanje adresa ; geografska lokacija ; stabla odlučivanja ; CP dekompozicija ; stršeće vrijednosti

nije evidentirano

engleski

A hierarchical analysis of character strings by statistical analysis and scientific computing

nije evidentirano

central limit theorem ; m-dependent sequence ; normal distribution ; palindromes in DNA ; string similarity ; postal addresses ; address extraction ; decision trees ; geographic location ; CP decomposition ; outliers

nije evidentirano

Podaci o izdanju

161

31.03.2014.

obranjeno

Podaci o ustanovi koja je dodijelila akademski stupanj

Prirodoslovno-matematički fakultet, Zagreb

Zagreb

Povezanost rada

Biologija, Matematika, Računarstvo

Poveznice