Napravljen je sustav koji se bavi usporedbom PDF dokumenata. Dokumenti se uspoređuju po principu svaki-sa-svakim, odnosno, svaki dokument iz skupa za provjeru će se usporediti sa svim ostalim dokumentima iz tog skupa. Mjera sličnosti dva dokumenta računa se na način da se svaku riječ iz prvog dokumenta usporedi sa njoj susjednim riječima iz drugog dokumenta, te se izračuna prosjek najveće mjere sličnosti između dviju riječi. Sličnost riječi računa se Levensteinovim i Jaro-Winklerovim algoritmom. |