哈夫曼编码的理解(Huffman Coding)

哈夫曼编码(Huffman Coding)，又称霍夫曼编码，是一种编码方式，可变字长编码(VLC)的一种。Huffman于1952年提出一种编码方法，该方法完全依据字符出现概率来构造异字头的平均长度最短的码字，有时称之为最佳编码，一般就叫做Huffman编码（有时也称为霍夫曼编码）。

哈夫曼编码，主要目的是根据使用频率来最大化节省字符（编码）的存储空间。

简易的理解就是，假如我有A,B,C,D,E五个字符，出现的频率（即权值）分别为5,4,3,2,1,那么我们第一步先取两个最小权值作为左右子树构造一个新树，即取1，2构成新树，其结点为1+2=3，如图：

虚线为新生成的结点，第二步再把新生成的权值为3的结点放到剩下的集合中，所以集合变成{5,4,3,3}，再根据第二步，取最小的两个权值构成新树，如图：

再依次建立哈夫曼树，如下图：

其中各个权值替换对应的字符即为下图：

所以各字符对应的编码为：A->11,B->10,C->00,D->011,E->010

霍夫曼编码是一种无前缀编码。解码时不会混淆。其主要应用在数据压缩，加密解密等场合。

如果考虑到进一步节省存储空间，就应该将出现概率大（占比多）的字符用尽量少的0-1进行编码，也就是更靠近根（节点少），这也就是最优二叉树-哈夫曼树。

原文地址：https://www.cnblogs.com/linhaostudy/p/12190270.html

时间： 2024-10-12 16:56:26

哈夫曼编码的理解(Huffman Coding)的相关文章

数据结构之哈弗曼编码的（Huffman Coding）加密解密压缩

Huffman树又叫最优二叉树,它的特点是带权路径最短. Huffman树的一个重要应用是Huffman编码,Huffman编码是长度最短的前缀编码.即给定要传送的字符的权值,根据权值求出Huffman编码,它一定是前缀编码(指任意字符的编码都不是另一个字符编码的前缀),并且在传送过程由字符组成的文字时,编码长度最小. 因此Huffman编码可以对文字进行加密解密还有压缩.加密的工作就是将文字转换为编码,解密工作是将编码转换为文字,如何转换本文不做详解(严蔚敏的<数据结构>书中有代码).那么如

哈夫曼编码(Huffman coding)的那些事,(编码技术介绍和程序实现)

前言哈夫曼编码(Huffman coding)是一种可变长的前缀码.哈夫曼编码使用的算法是David A. Huffman还是在MIT的学生时提出的,并且在1952年发表了名为<A Method for the Construction of Minimum-Redundancy Codes>的文章.编码这种编码的过程叫做哈夫曼编码,它是一种普遍的熵编码技术,包括用于无损数据压缩领域.由于哈夫曼编码的运用广泛,本文将简要介绍: 哈夫曼编码的编码(不包含解码)原理代码(java)实现过程一

Huffman Coding 哈夫曼编码

作者:jostree 转载请注明出处 http://www.cnblogs.com/jostree/p/4096079.html 使用优先队列实现,需要注意以下几点: 1.在使用priority_queue时,内部需要存储哈夫曼树节点的指针,而不能是节点.因为构建哈夫曼树时,需要把其左右指针指向孩子,而如果储存的是节点,那么孩子的地址是会改变的.同理节点应当使用new在内存中开辟,而不能使用vector,原因是vector在数组大小为2整数次幂时,大小会倍增,开辟新数组并把老数组的数字copy过

哈夫曼（huffman）树和哈夫曼编码

哈夫曼树哈夫曼树也叫最优二叉树(哈夫曼树) 问题:什么是哈夫曼树? 例:将学生的百分制成绩转换为五分制成绩:≥90 分: A,80-89分: B,70-79分: C,60-69分: D,<60分: E. if (a < 60){ b = 'E'; } else if (a < 70) { b = ‘D’; } else if (a<80) { b = ‘C’; } else if (a<90){ b = ‘B’; } else { b = ‘A’; } 判别树:用于描述分类

(转)哈夫曼（huffman）树和哈夫曼编码

原文地址哈夫曼树也叫最优二叉树(哈夫曼树) 问题:什么是哈夫曼树? 例:将学生的百分制成绩转换为五分制成绩:≥90 分: A,80-89分: B,70-79分: C,60-69分: D,<60分: E. if (a < 60){ b = 'E'; } else if (a < 70) { b = ‘D’; } else if (a<80) { b = ‘C’; } else if (a<90){ b = ‘B’; } else { b = ‘A’; } 判别树:用于描述分类

数据压缩之经典——哈夫曼编码(Huffman)

(笔记图片截图自课程Image and video processing: From Mars to Hollywood with a stop at the hospital的教学视频,使用时请注意版权要求.) JPEG用哈夫曼编码(Huffman Encoder)作为其符号编码.哈弗曼编码是压缩算法中的经典,它理论上可以将数据编成平均长度最小的无前缀码(Prefix-Free Code). 为什么要进行编码? 关于Lena:莱娜图(Lenna)是指刊于1972年11月号<花花公子>(Pla

数据压缩算法之哈夫曼编码（HUFFMAN）的实现

HUFFMAN编码可以很有效的压缩数据,通常可以压缩20%到90%的空间(算法导论).具体的压缩率取决于数据的特性(词频).如果采取标准的语料库进行编码,一般可以得到比较满意的编码结果(对不同文件产生不同压缩率的折中方法). 本文采取对单独一个文件进行编码的方式来演示此压缩算法的使用. 分为下面几个步骤: 1.统计词频数据 2.词频数据转换成HUFFMAN算法能够处理的类型(本文为HuffmanNode,内部有存储词频和树节点的结构) (1)由输入的HuffmanNode[]数组创建最小优先级队

哈夫曼(Huffman)树与哈夫曼编码

声明:原创作品,转载时请注明文章来自SAP师太技术博客:www.cnblogs.com/jiangzhengjun,并以超链接形式标明文章原始出处,否则将追究法律责任!原文链接:http://www.cnblogs.com/jiangzhengjun/p/4289610.html 哈夫曼树又称最优二叉树,是一种带权路径长最短的树.树的路径长度是从树根到每一个叶子之间的路径长度之和.节点的带树路径长度为从该节点到树根之间的路径长度与该节点权(比如字符在某串中的使用频率)的乘积. 比如有一串字符串如

哈夫曼（Huffman)树和哈夫曼编码

一.哈夫曼(Huffman)树和哈夫曼编码 1.哈夫曼树(Huffman)又称最优二叉树,是一类带权路径长度最短的树, 常用于信息检测. 定义: 结点间的路径长度:树中一个结点到另一个结点之间分支数目称为这对结点之间的路径长度. 树的路径长度:树的根结点到树中每一结点的路径长度之和. 带权路径长度:从根结点到某结点的路径长度与该结点上权的乘积. 树的带权路径长度:树中所有叶子结点的带权路径长度之和记为WPL. 例如: 对图(a): WPL =9×2+5×2+2×2+3×2=38 对图(b): W

猜你喜欢

黑马程序员——基本数据类型

package com.yang.ex; /* * 基本数据类型对象包装类 * byte Byte * short Short * int Integer * long Long * boole ...

MyBatis-增删改查

1.创建Maven项目,项目名称mybatisdemo1,目录结构如图所示 2.pom.xml中配置内容如下 <project xmlns="http://maven.apache.o ...

电光火华之间的问题，实在是太巧了

新发现一个问题,居然在电光火华之间,时间从昨天变到了今天,但变量的值还是昨天取的,但是使用的时候却已经是今天了,这样条件判断就出错了. 而且更巧的时候,第一个任务的开始运行占了不少时间,因此当判断第二 ...

4、SSH的整合

4.1.和hibernate的整合 1.写hibernate的配置文件并且完成bean的创建,完成相应的映射 2.写spring的beans.xml 使用spring来管理hibernate最 ...

第三部分php配置和mysql配置

9. 配置防盗链http://www.lishiming.net/thread-71-1-1.html 防止别人的网站,放你网站图片的链接, 位置一般情况下在 /usr/local/apache/co ...

关于url

URL即统一资源定位器用于定位万维网上的文档或其他数据,URL 可以由单词组成,比如 “www.baidu.com”,或者是因特网协议(IP)地址:192.168.x.xxx.大多数人在网上冲浪时,会 ...

Java学习笔记二---环境变量

1.环境变量包括: JAVA_HOME,CLASSPATH,PATH 2.设置环境变量的目的: 路径搜索,方便查找到Java的安装路径.方便搜索用到的类.方便命令执行等. 3.各环境变量的含义: ①. ...

题目1161：Repeater（规律输出图形）

题目1161:Repeater 题目链接:http://ac.jobdu.com/problem.php?pid=1161 具体分析:https://github.com/zpfbuaa/JobduI ...

What's New In DevTools (Chrome 59)来看看最新Chrome 59的开发者工具又有哪些新功能

原文:https://developers.google.com/web/updates/2017/04/devtools-release-notes#command-menu 参考:https:// ...

js中的constructor与prototype

constructor始终指向创建当前对象的构造函数.比如下面例子: // 等价于 var foo = new Array(1, 56, 34, 12); var arr = [1, 56, 34, ...

java三大特性之封装

1.封装封装概述:是指隐藏对象的属性和实现细节,仅仅对外提供公共访问方式. 好处: 隐藏实现细节,提供公共的访问方式提高了代码的复用性提高了安全性封装原则: 将不需要对外提供的内容都隐藏起来. ...

echo(),print(),print_r(),var_dump的区别？

常见的输出语句 echo()可以一次输出多个值,多个值之间用逗号分隔.echo是语言结构(language construct),而并不是真正的函数,因此不能作为表达式的一部分使用. print()函 ...

shell下的基础程序题练习

1.简单的进度条程序 lable数组相当于进度条前进时,那个刷新的圆圈,进度条前进时显示进度,用count%显示程序运行结果: 2.1-100之间的求和 1>用while实现 ...

Python mysql-数据库基础知识

2017-09-05 19:10:55 一.数据库定义从本质上讲,数据库就是信息的集合,它可以存在很长时间,往往是很多年.一般来讲,"数据库"这个词指的是有数据库管理系统管理的数 ...

十大企业级Linux服务器安全防护要点

随着开源系统Linux的盛行,其在大中型企业的应用也在逐渐普及,很多企业的应用服务都是构筑在其之上,例如Web服务.数据库服务.集群服务等等. 因此,Linux的安全性就成为了企业构筑安全应用的一个基 ...

开启mongod服务（Mongo运行错误：Failed to connect 127.0.0.1:27017,reason:errno:10061由于目标计算机积极拒绝，无法连接）

问题:Mongo运行错误:Failed to connect 127.0.0.1:27017,reason:errno:10061由于目标计算机积极拒绝,无法连接在Mongodb的安装过程中碰到的问 ...

检测一个document是否存在（checking whether a document exists）

如果你仅仅是要检查一个document是否存在,而对document的内容不感兴趣,你可以使用HEAD进行查询 curl -i -XHEAD /website/blog/123 如果document存 ...

JQuery中的find、filter和each方法学习

find() 概述搜索所有与指定表达式匹配的元素.这个函数是找出正在处理的元素的后代元素的好方法. 所有搜索都依靠jQuery表达式来完成.这个表达式可以使用CSS1-3的选择器语法来写. 参数 e ...

Eclipse增加内存

在使用eclipse的过程中,时不时就会出现"内存溢出"的问题,一个解决办法就是在启动eclipse时增加其内存使用,通过命令行方式: eclipse -vmargs -Xms51 ...

asp.net GDI+ 使用PathGradienBrush类实现彩色渐变

1 using System; 2 using System.Collections.Generic; 3 using System.Linq; 4 using System.Web; 5 using ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.024 s.