Nalazite se na CroRIS probnoj okolini. Ovdje evidentirani podaci neće biti pohranjeni u Informacijskom sustavu znanosti RH. Ako je ovo greška, CroRIS produkcijskoj okolini moguće je pristupi putem poveznice www.croris.hr
izvor podataka: crosbi !

Zakon o veličini vokabulara teksta. Heapsov zakon i određivanje veličine vokabulara tekstova na hrvatskom jeziku. Dokumetacija. (CROSBI ID 755394)

Druge vrste radova | rukopis

Tuđman, Miroslav ; Boras, Damir ; Mikelić, Nives Zakon o veličini vokabulara teksta. Heapsov zakon i određivanje veličine vokabulara tekstova na hrvatskom jeziku. Dokumetacija. // projekt 0130443. 2004.

Podaci o odgovornosti

Tuđman, Miroslav ; Boras, Damir ; Mikelić, Nives

hrvatski

Zakon o veličini vokabulara teksta. Heapsov zakon i određivanje veličine vokabulara tekstova na hrvatskom jeziku. Dokumetacija.

Postojeća formula /Vr(n) = Knβ / Heapsova zakona o veličini vokabulara teksta nije univerzalna te je zakon potrebno redefinirati, kako bi se mogao koristiti za analizu korpusa na različitim jezicima. Analiza korpusa tekstova na hrvatskom jeziku potvrđuje hipotezu da je broj funkcionalnih pojavnica (F) u tekstu konstantan te iznosi 21% veličine teksta n (funkcionalnih pojavnica u engleskim je tekstovima 26%). Autor dokazuje da se postotak funkcionalnih pojavnica u tekstu može koristiti kao vrijednost za parametar K, te da je parametar K konstantna vrijednost za svaki jezični korpus. Empirijska istraživanja potvrđuju autorovu tezu da se broj funkcionalnih pojavnica u tekstu može izračunati po formuli F = nK/100, a da za veličinu najfrekventnije pojavnice (MF) vrijedi formula M F = n (K/100) 2. Vrijednost drugog parametra Heapsovog zakona također se može precizno odrediti: β = log K/100. Zato autor predlaže novi oblik zakona o veličini vokabulara teksta: Vr(n) = (Kn)β . Broj riječi koje se javljaju samo jedanput (HL) u tekstu može se izračunati po formuli: HL = ((Kn)/2)β . Istraživanja potvrđuju da je vrlo visoka korelacija između izračunatih i stvarnih vrijednosti veličine vokabulara, odnosno između stvarnih i izračunatih vrijednosti jednokratnih riječi u tekstu. Ovako interpretiran i definiran zakon o veličini vokabulara teksta omogućava izračun veličine vokabulara teksta na svakom jeziku, kada se zna postotak funkcionalnih riječi koji je konstantan za svaki jezik. No, ova interpretacija zakona omogućava osim izračuna veličine vokabulara teksta, i određivanje broja funkcionalnih pojavnica u tekstu, veličine najfrekventnije riječi u tekstu, te broja jednokratnih pojavnica koje tvore vokabular teksta.

heapsov zakon; veličina rječnika; hapax legomena; različnice; funkcionalne riječi

nije evidentirano

engleski

Heaps' law and vocabulary size of Croatian texts. Documentation.

nije evidentirano

heaps' law; vocabulary size; hapax legomena; types; tokens; functional words

nije evidentirano

Podaci o izdanju

projekt 0130443

2004.

nije evidentirano

objavljeno

Povezanost rada

Informacijske i komunikacijske znanosti