dna2vec: vektorska reprezentacija k-torki različite duljine (CROSBI ID 411198)
Ocjenski rad | sveučilišni preddiplomski završni rad
Podaci o odgovornosti
Kutnjak, Mateo
Šikić, Mile
hrvatski
dna2vec: vektorska reprezentacija k-torki različite duljine
Usporedba dijelova genoma obavlja se prilagođavanjem metode word2vec radu s k- torkama. Ispitivana metoda dna2vec ima omogućuje rad s varijabilnom duljinom ktorki u itervalu [3 ; 8]. Treniranje izvedbom Skip-Gram koja u obzir uzima kontekst genoma oko k-torke, dobija se pozicija k-torke u višedimenzionalnom vektorskom prostoru. Kosinusna udaljenost dvije vektorske reprezentacije k-torki daje mjeru njihove sličnosti. Ispitana je i dokazana korelacija kosinusne udaljenosti metodom dna2vec i rezultata algoritma Needleman-Wunsch za par k-torki. Dodatno su prodiskutirani razlozi dugotrajnog učenja te su predložena ubrzanja učenja te poboljšanje efikasnosi ispitanog modela.
dna2vec, k-torke, sličnost, strojno učenje, neuronska, mreža
nije evidentirano
engleski
dna2vec: vector representation of variable length k-mers
nije evidentirano
dna2vec, k-mers, similarity, neural network, machine, learning
nije evidentirano
Podaci o izdanju
31
04.07.2017.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb