Poboljšani algoritam za izbor i provjeru kvalitete najboljih multivarijacijskih modela odnosa strukture i svojstava molekula (CROSBI ID 368356)
Ocjenski rad | magistarski rad (mr. sc. i mr. art.)
Podaci o odgovornosti
Papeš Šokčević, Lidija
Šikić, Mile ; Lučić, Bono
hrvatski
Poboljšani algoritam za izbor i provjeru kvalitete najboljih multivarijacijskih modela odnosa strukture i svojstava molekula
Algoritam za izbor najboljih mogućih multivarijatnih modela (prema koeficijentu korelacije) razvijen je za potrebe primjena u istraživanju lijekova. Realiziran je u programskom jeziku Visual Basic i povezan je s bazom podataka. U radu je istražen odnos između statističkih parametara izračunatih na podacima u postupku prilagodbe na skupu za učenje, križne provjere ispuštanjem određenog postotka podataka skupa za učenje i u postupku predviđanja na vanjskom skupu podataka. Postupak križne provjere u kojem se u svakom koraku izbacuju veći podskupovi podataka pokazuje bolje slaganje s rezultatima dobivenim u predviđanju na vanjskom skupu nego najčešće korišteni postupak križne provjere u kojem se u svakom koraku izbacuje po jedna molekula. Nadalje, slaganje između statističkih parametara izračunatih u postupku prilagodbe na skupu za učenje i odgovarajućih parametara izračunatih u postupcima križnih provjera i na vanjskome skupu, znatno je bolje nego slaganja objavljivana u literaturi. To potvrđuje dobre strane primijenjenog postupka početne eliminacije deskriptora, smanjenja korelacije između deskriptora, postupka modeliranja i primijenjenoga algoritma za izbor modela. Za razliku od uobičajenih postupaka križne provjere koji se rabe u literaturi istražile su se učestalosti pojavljivanja pojedinih deskriptora u najboljim modelima. Na temelju tih analiza načinio se redoslijed važnosti pojedinih deskriptora u najboljim modelima, što je važna informacija pri interpretaciji i uporabi najboljih modela. Dobiveni rezultati i razvijena aplikacija MR_QSAR vrijedan su znanstveni i stručni doprinos području razvoja i primjene računalnih algoritama za modeliranja svojstava i aktivnosti molekula koja se provode u znanstvenim krugovima, u istraživanjima novih lijekova u farmaceutskoj industriji, te u zaštiti okoliša u postupcima procjene toksičnosti molekula.
QSAR modeliranje ; multivarijacijska linearna regresija ; izbor deskriptora ; razvoj modela ; statistički parametri ; prilagodba modela ; križna provjera ; vanjska provjera ; topljivost molekula u vodi
nije evidentirano
engleski
Improved algorithm for selection and validation of best multivariate structure-property molecular models
nije evidentirano
QSAR modeling ; multivariate linear regresion ; selection of descriptors ; model development ; statistical parameters ; model fitting ; cross-validation ; external validation ; water solubility of molecules
nije evidentirano
Podaci o izdanju
72
26.10.2011.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb