Reducing Variance in Huffman Trees

, \t\t , Method to reduce variance in Huffman Trees., #Consider a Huffman tree to be constructed for the symbols : a_1,a_2,....,a_n., Let their probabilities be p(1),p(2),....,p(n) and the length of their codes be, l(1),l(2),...,l(n)., Now, the average length of the codes is the weighted path length of the Huffman tree, constructed,which is :avg= p(1)l(1)+p(2)l(2)+......+p(n)l(n)., #Now,I shall define variance as:, V= p(1)[l(1)-avg]^2 + p(2)[l(2)-avg]^2+.....+p(n)[l(n)-avg]^2., Variance thus gives an idea of how much the encoder has to keep varying the number of bits generated.If the encoder were to write the codes into a file then variance makes no difference. men hvis de koder, var at sende koderne, så mindre varians er foretrak.i tilfælde af overførsel af dele, der skal forblive konstant. men hvis der bliver ved med at ændre en buffer skal opretholdes af koder.større variation, mindre konstant er den hastighed, hvormed de ting ind i bufferen. så bufferen skal være stort. nu vil jeg beskrive en metode til at mindske variansen: når der er mere end to mindste sandsynlighed knudepunkter, udvælge dem, der er den laveste og højeste i træet og kombinere dem.,,, det vil kombinere symboler for lav sandsynlighed for, og med stor sandsynlighed og reducere den samlede varians., * f.eks. tage sandsynligheder: 1 /20 /20,2 /20,2 /20,4 /20,10 /20, finder kun tæller for at lette: 1,1,2,2,4,10. nu, vi kombinerer 1 og 1. for at give "2", så har vi: "2", 2,2,4,10. her, "2" står for 2 skabt ved at samle børn knudepunkter. vælg "2" og 4 og forene dem. udvælger de to andre 2s og lægge dem sammen. så har vi "4" og "6", så kombinere "4" og "6" for at nå frem til "10". så comnine "10" og 10 for at give "20". den gennemsnitlige lysvejlængde = 2,1 bit /symbol. variansen kommer ud til at være: 1.290. nu kan vi prøve en anden måde at opbygge den samme træ. vi kan fusionere 1,1 for at få "2", "2" og 2 giver "4", 2 og "4" give "6", og "6" 4. "10." endelig "10" og 10 giver "20". den gennemsnitlige lysvejlængde = 2,1 bit /symbol. variansen kommer ud til at være: 1.890, hvilket er mere end den første sag. dermed tanken ligger i at vælge bedre træ blandt de mulige, når det gælder varians.



Previous:
Next Page: