当前大家对于霍夫曼编码都是颇为感兴趣的,大家都想要了解一下霍夫曼编码,那么小美也是在网络上收集了一些关于霍夫曼编码的一些信息来分享给大家,希望能够帮到大家哦。
1、霍夫曼编码(英语:Huffman Coding),又译为哈夫曼编码、赫夫曼编码,是一种用于无损数据压缩的熵编码(权编码)算法。
2、由大卫·霍夫曼在1952年发明。
3、在计算机数据处理中,霍夫曼编码使用变长编码表对源符号(如文件中的一个字母)进行编码,其中变长编码表是通过一种评估来源符号出现机率的方法得到的,出现机率高的字母使用较短的编码,反之出现机率低的则使用较长的编码,这便使编码之后的字符串的平均长度、期望值降低,从而达到无损压缩数据的目的。
4、例如,在英文中,e的出现机率最高,而z的出现概率则最低。
5、当利用霍夫曼编码对一篇英文进行压缩时,e极有可能用一个比特来表示,而z则可能花去25个比特(不是26)。
6、用普通的表示方法时,每个英文字母均占用一个字节,即8个比特。
7、二者相比,e使用了一般编码的1/8的长度,z则使用了3倍多。
8、倘若我们能实现对于英文中各个字母出现概率的较准确的估算,就可以大幅度提高无损压缩的比例。
9、霍夫曼树又称最优二叉树,是一种带权路径长度最短的二叉树。
10、所谓树的带权路径长度,就是树中所有的叶结点的权值乘上其到根结点的路径长度(若根结点为0层,叶结点到根结点的路径长度为叶结点的层数)。
11、树的路径长度是从树根到每一结点的路径长度之和。
本文到此结束,希望对大家有所帮助。