香农的信息论

之前只知道香农于1948年发表的那篇举世瞩目的paper,《A Mathematical Theory of Communication》,过了一年拉上Warren Weaver作为共同作者出了个单行本,标题只改了一个字,《The Mathematical Theory of Communication》,而Weaver的贡献只是写了份摘要。随手搜了下,原论文索引竟然高达八万多次......

下载地址。

现在经过了解才知道,香农、巴丁(可能还有肖克利)之于电子工程,就是牛顿、麦克斯韦之于物理学,图灵、冯诺依曼之于计算机科学,都是真正通过一己之力开创了一门学科。他们的工作,使得一些零散的研究终于有了体系和系统的方法,而之所以在今人的眼里看起来普普通通,只是因为他们的工作是一切后来者都不能绕过的基石。

信息论最初所处理的问题是数据压缩与传输邻域中的问题,其处理方法利用了熵和互信息等基本量。

如果随机变量的概率密度函数为,那么的熵定义为:

熵的量纲为比特,由香农一人提出。熵可以看作随机变量的平均不确定度的度量。在平均意义下,是为了描述该随机变量所需的比特数。

单个随机变量的熵为该随机变量的不确定度,涉及两个随机变量的条件熵,即一个随机变量在给定另外一个随机变量的条件下的熵。由另一个随机变量导致的原随机变量不确定度的缩减量称为互信息。具体来说,设是两个随机变量,那么这个缩减量为互信息,

互信息是两个随机变量相互之间独立程度的度量,它关于对称,并且永远为非负值,当且仅当相互独立时,等于零。

互信息实际上是更广泛量相对熵的特殊情形。相对熵是两个概率密度函数之间的“距离”度量,定义为,

想对熵非负,为0的充分必要条件为

通信通道是一个系统,系统的输出信号按概率输入信号。该系统特征由一个转移概率矩阵决定,该矩阵决定在给定输入情况下输出的条件概率分布。对于输入信号为和输出信号为的通信信道,定义它的信道容量为,

容量是可以使用该信道发送信息的最大速率,而且在接收端以极低的误差概率恢复出该信息。(香农证明了只要通信速率低于通道容量,总可以使误差概率接近于零。)

信息论与电子工程(通信理论)、计算机科学(科尔莫戈罗夫复杂度)、物理学(热力学)、数学(概率论和统计学)、哲学(奥克姆剃刀)、经济学(投资)、计算与通信邻域都有交叉。

时间: 2024-10-12 16:46:12

香农的信息论的相关文章

关于傅里叶分析与香农采样定理

主要内容: 1.傅里叶分析 2.香农采样定理 一.傅里叶变换 参考: 傅里叶分析之掐死教程 http://zhuanlan.zhihu.com/wille/19763358 二.香农采样定理 香农采样定理说,只要采样频率大于被采样信号最高频率的两倍,就能完全恢复. 链接:http://www.zhihu.com/question/24490634/answer/28430016来源:知乎 Nyquist采样定理是连接连续和离散的桥梁 现实世界接触到的诸如电信号.光信号.声音信号等这些信号都是随时

搜索技术(2)

自然语言处理 基于规则 基于统计 统计语言模型 中文分词 梁南元--查字典 郭进--统计语言模型 Basis Technology 通用分词器 葛显平.朱安 隐含马尔科夫模型 信息熵 贾里尼克.香农.雅各布森.乔姆斯基.弗兰德.哈克特 统计语音识别和自然语言处理 雅让斯基.布莱尔 阿米特.辛格 搜索引擎:自动下载尽可能多的网页--->建立快速有效的索引--->根据相关性对网页进行公平准确的排序 搜索原理:下载---->索引----->排序 布尔代数:George Boole:与.或

第六章:信息的度量和作用

1.信息熵 我们用一个生动的例子来说明这个概念:刚好这几天举行世界杯,我们都会猜谁会获得冠军.假设有32支球队,编号从1-32.然后问:“冠军是在1-16中吗?”,不是的话就是在6-32中,一次类推.我们最多需要猜测5次就能猜出谁是冠军(log32).但事实上,我们可能不需要5次就能猜出来,因为像巴西,德国,意大利这样的强队获得冠军的可能性比其他的要高.然后分组的时候,把少数几支强队放在一组.,以此类推,就不需要5次就能算出来.香农不用次,而是用“比特”(Bit)这个概念来衡量信息量.他指出,以

凯利公式的模拟验证

凯利公式的模拟验证 场景:一个赌局,你跟庄家.你出 1 元,庄家出 0.96元.赌金数目可随之翻倍.    根据每次抛色子的结果的单双决定胜负.    胜者得到双方所下的赌金,计 1.96 元. 问题:如何下注才能做到,风险最小,盈利最大呢? 答案:凯利公式. 凯利公式的作用: 根据赔率与胜率,得出你每次的资金下注比例 公式的两种形式: 公式:(期望报酬率)/(赔率) 公式:(盈利概率×盈利金额-亏损概率×亏损额)/(盈利额 / 亏损额) 凯利公式最初为 AT&T 贝尔实验室物理学家约翰·拉里·

决策树之信息与熵的计算

一.引言 之前提到的k-近邻算法是分类数据最简单最有效的算法.k-近邻算法是基于实例的学习,使用算法时我们必须有接近实际数据的训练样本数据.而且,k-近邻数据必须保全全部数据集,如果训练数据集的很大,必须使用大量的存储空间,此外k-近邻算法必须对数据集中的每个数据计算距离,这是非常耗时的.另外,对于数据的基础结构信息,它也是无能为力的. 另一种分类算法就是“决策树算法”.对待一个数据,决策树使用多个决策判断确定最终的分类,举个小例子说明一下:给定一个动物,判断什么动物的分类,首先“它是哺乳类动物

硬件开源为什么如此之难?

硬件开源为什么如此之难? 2015-10-01 16:31 原创 喵酱 4条评论 [编者按]本文来自知乎,由作者@Dee ne 授权转载. 开源硬件会像开源软件给软件业带来的影响那样,也给硬件相关技术(以及硬件团队自身)带来巨大发展吗?这也许是每一个硬件工程师(当然也包括软件工程师)都会思考的问题.硬件与软件毕竟不一样,本文主要从硬件开源与软件开源的区别的角度,来简单说说硬件开源为什么那么难. 首先我们要明确的是:硬件的开源工作远远要比软件复杂. 为什么呢?因为硬件工程相对于软件工程而言,有着以

读书笔记:计算机网络第二章:物理层

这是我在Coursera上的学习笔记.课程名称为<Computer Networks>,出自University of Washington. 由于计算机网络才诞生不久,目前正在以高速在发展,所以有些旧的教材可能都已经跟不上时代了.这门课程在2013年左右录制,知识相对还是比较新的.覆盖了计算机网络中的各个协议层,从物理层到应用层都讲得非常仔细.学完这门课程之后对计算机网络会有比较深刻的了解. 本章详细讲解了物理层,讲解了比特流如何通过各种介质进行传播. 基本概述 物理层的功能 专注比特信号是

重新认识数据

误入数据分析行业已有5年多,由于并非"科班"专业毕业,自己从编程到统计理论基础,从简单线性回归到SVM.GBDT.LSTM等复杂算法一路跌跌撞撞学习过来,蓦然回首,才发现做了这么久的数据分析.数据挖掘.大数据等,却没有系统地思考过"数据"这一最基础的要素的确切含义和特性.而所有行业中,基础要素的概念和特性,无疑都是武侠中的"气宗"之本,决定了最终修为的境界高低.回忆所学,似乎也没有哪本书专门讲过"数据"本身,大概大家都对这个词

辛东方:人工智能究竟离我们还有多远?

科技的发展,让人类社会步入一个高速前进的智能圈子.人工智能的出现,根本上促进了技术的革新.新产能.新工具也因为人工智能的出现变得更加激动灵活.人工智能的出现,是否说明它真正对人类社会产生巨大的变化,或者说仅仅是一个开始? 文/辛东方(80后作家.专栏作者.专注互联网科技领域) "人工智能"一词最早出现在1956年,距今已有60年时间了.1956年,包括约翰·麦肯锡.马文·明斯基.克劳德香农(信息论创立者)在内的数十位数学家.计算机学家在达特茅斯召开了两个月的学术会议,会议的主题是:用机