Strojno potpomognuta izgradnja i semantičko pretraživanje zbirki pitanja i odgovora. (CROSBI ID 418987)
Ocjenski rad | doktorska disertacija
Podaci o odgovornosti
Karan, Mladen
Šnajder, Jan
hrvatski
Strojno potpomognuta izgradnja i semantičko pretraživanje zbirki pitanja i odgovora.
Rad se bavi nizom zadataka definiranih nad zbirkama često postavljanih pitanja (engl. Frequently Asked Question Collections – FAQ-zbirke). Poseban naglasak bio je na razmatranju strojno potpomognutih postupaka koji uzimaju u obzir specifična svojstva FAQ zbirki. Izgrađena su tri nova skupa podataka na engleskom jeziku. Prvi istražen zadatak bila je strojno potpomognuta izgradnja FAQ-zbirke. Predložen je postupak temeljen na aktivnom učenju grupiranja s ograničenjima i pretraživanju informacija. Drugi zadatak bio je postupak za otkrivanje pitanja koja nisu pokrivena FAQ-zbirkom. Predložen je postupak za otkrivanje nedostajućih pitanja temeljen vektorskim reprezentacijama riječi. Konačno, treći zadatak je semantičko pretraživanje FAQ-zbirke. Predložene su dvije vrste modela, koji se temelje na nadziranome strojnom učenju rangiranja. Pokazano je da obje vrste modela daju u praksi značajna poboljšanja točnosti pretraživanja u usporedbi s nenadziranim alternativama uz razmjerno malen rad uložen u označavanje. Izvorni znanstveni doprinosi: 1. Postupak za strojno potpomognutu izgradnju zbirke pitanja i odgovora temeljen na postupcima grupiranja tekstnih podataka i pretraživanja tekstnih informacija ; 2. Postupak za strojno potpomognutu nadgradnju zbirke pitanja i odgovora temeljen otkrivanju nepostojećih odgovora u zbirci primjenom metoda strojnog učenja ; 3. Model za semantičko pretraživanje zbirke pitanja i odgovora temeljen na jezično neovisnim statističkim značajkama.
Često postavljana pitanja, odgovaranje na pitanja, pretraživanje informacija, grupiranje s ograničenjima, aktivno učenje, učenje rangiranja, konvolucijska neuronska mreža, semantičko pretraživanje
nije evidentirano
engleski
Computer-aided Construction and Semantic Search of Question and Answer Collections.
nije evidentirano
Frequently asked questions, Question answering, Information retrieval, Cons- trained clustering, Active learning, Learning to rank, Convolutional neural network, Semantic search
nije evidentirano
Podaci o izdanju
138
21.12.2017.
obranjeno
Podaci o ustanovi koja je dodijelila akademski stupanj
Fakultet elektrotehnike i računarstva
Zagreb