数字图像处理学第5章图像编码(第二讲)5.4统计编码高效编码的主要方法是尽可能去除信源中的冗余成份,从而以最少的数码率传递最大的信息量。冗余度存在于像素间的相关性及像素值出现概率的不均等性之中。对于有记忆性信源来说首先要去除像素间的相关性,从而达到压缩数码率的目的。对于无记忆性信源来说,像素间没有相关性,可以利用像素灰度值出现概率的不均等性,采用某种编码方法,也可以达到压缩数码率的目的。这种根据像素灰度值出现概率的分布特性而进行的压缩编码叫统计编码。5.4.2几种常用的统计编码法5.4.1编码效率与冗余度5.4.1编码效率与冗余度为了确定一个衡量编码方法优劣的准则,编码效率冗余度设某个无记忆信源共有M个消息,记作。其中消息各自出现的概率分别为。可把这个信源用下式表示uuuuM123,,,,ppppM123,,,,XuuuuppppMM123123,,,,,,,,(5—22)根据该信源的消息集合,在字母集中选取符号进行编码。一般情况下取二元字母集A{1,0}。通常,这一离散信源中的各个消息出现的概率并不相等。根据信息论中熵的定义,可计算出该信源的熵如下式:Aaaaan{,,,}123iaiMiPPXHlog1)((5—23)式中H(X)代表熵,Pi代表第i个消息出现的概率。例如,设一离散信源如下Xuuuu123412141818由式(5—23)可算出该信源的熵HXppiii()log1421212141418181818742222loglogloglog比特/消息设对应于每个消息的码字由Ni个符号组成。也就是说每个消息所对应的码字长度各为Ni。那么,每个消息的平均码长可用下式表示iiMiNPN1(5—24)式中代表平均码长,M为信源中包含的消息的个数,Pi为第i个消息出现的概率,Ni为第i个消息对应的码长。就平均而言,每个符号所含有的熵为SHXN()(5—25)N编码符号是在字母集A中选取的。如果编码后形成一个新的等概率的无记忆信源,字母数为n,那么,它的最大熵应为logan比特/符号,因此,这是极限值。如果,则可认为编码效率已达到100%,若,则可认为编码效率较低。由上述概念,编码效率如下式表示:HXNna()logHXNna()logHXNna()log式中代表编码效率,H(X)为信源的熵,为平均码长,n为字母集合中的字母数。N(5—26)如果以比特(bit)作单位,loga的底为2,根据上述定义,则HXNn()log2100%%100log)(2nNXH显然,如果,就说明还有冗余度。因此,冗余度如下式表示%100nNXHnNRd22log)(log1(...