哈夫曼编码(Huffman Coding),又称霍夫曼编码,是一种编码方式,哈夫曼编码是可变字长编码(VLC)的一种,该方法完全依据字符出现概率来构造异字头的平均长度最短的码字,有时称之为最佳编码,也称霍夫曼(Huffman)编码。
霍夫曼编码的基本方法是先对数据(如:文章)扫描一遍,计算出各数据元素(文字)出现的概率,按概率的大小指定不同长度的唯一码字,由此得到的一张霍夫曼码表。
如:某文章只包含了“我”、“爱”、“中”、“国”四个字,它们出现的概念分别为0.125、0.125、0.2、0.3,那么它们的编码可以分别设为1000、1001、101和11。