香农的信息论

之前只知道香农于1948年发表的那篇举世瞩目的paper，《A Mathematical Theory of Communication》，过了一年拉上Warren Weaver作为共同作者出了个单行本，标题只改了一个字，《The Mathematical Theory of Communication》，而Weaver的贡献只是写了份摘要。随手搜了下，原论文索引竟然高达八万多次......

下载地址。

现在经过了解才知道，香农、巴丁（可能还有肖克利）之于电子工程，就是牛顿、麦克斯韦之于物理学，图灵、冯诺依曼之于计算机科学，都是真正通过一己之力开创了一门学科。他们的工作，使得一些零散的研究终于有了体系和系统的方法，而之所以在今人的眼里看起来普普通通，只是因为他们的工作是一切后来者都不能绕过的基石。

信息论最初所处理的问题是数据压缩与传输邻域中的问题，其处理方法利用了熵和互信息等基本量。

如果随机变量的概率密度函数为，那么的熵定义为：

熵的量纲为比特，由香农一人提出。熵可以看作随机变量的平均不确定度的度量。在平均意义下，是为了描述该随机变量所需的比特数。

单个随机变量的熵为该随机变量的不确定度，涉及两个随机变量的条件熵，即一个随机变量在给定另外一个随机变量的条件下的熵。由另一个随机变量导致的原随机变量不确定度的缩减量称为互信息。具体来说，设和是两个随机变量，那么这个缩减量为互信息，

互信息是两个随机变量相互之间独立程度的度量，它关于和对称，并且永远为非负值，当且仅当和相互独立时，等于零。

互信息实际上是更广泛量相对熵的特殊情形。相对熵是两个概率密度函数和之间的“距离”度量，定义为，

想对熵非负，为0的充分必要条件为。

通信通道是一个系统，系统的输出信号按概率输入信号。该系统特征由一个转移概率矩阵决定，该矩阵决定在给定输入情况下输出的条件概率分布。对于输入信号为和输出信号为的通信信道，定义它的信道容量为，

容量是可以使用该信道发送信息的最大速率，而且在接收端以极低的误差概率恢复出该信息。(香农证明了只要通信速率低于通道容量，总可以使误差概率接近于零。)

信息论与电子工程(通信理论)、计算机科学(科尔莫戈罗夫复杂度)、物理学(热力学)、数学(概率论和统计学)、哲学(奥克姆剃刀)、经济学(投资)、计算与通信邻域都有交叉。

时间： 2024-10-12 16:46:12

香农的信息论的相关文章

关于傅里叶分析与香农采样定理

主要内容: 1.傅里叶分析 2.香农采样定理一.傅里叶变换参考: 傅里叶分析之掐死教程 http://zhuanlan.zhihu.com/wille/19763358 二.香农采样定理香农采样定理说,只要采样频率大于被采样信号最高频率的两倍,就能完全恢复. 链接:http://www.zhihu.com/question/24490634/answer/28430016来源:知乎 Nyquist采样定理是连接连续和离散的桥梁现实世界接触到的诸如电信号.光信号.声音信号等这些信号都是随时

搜索技术(2)

自然语言处理基于规则基于统计统计语言模型中文分词梁南元--查字典郭进--统计语言模型 Basis Technology 通用分词器葛显平.朱安隐含马尔科夫模型信息熵贾里尼克.香农.雅各布森.乔姆斯基.弗兰德.哈克特统计语音识别和自然语言处理雅让斯基.布莱尔阿米特.辛格搜索引擎:自动下载尽可能多的网页--->建立快速有效的索引--->根据相关性对网页进行公平准确的排序搜索原理:下载---->索引----->排序布尔代数:George Boole:与.或

第六章:信息的度量和作用

1.信息熵我们用一个生动的例子来说明这个概念:刚好这几天举行世界杯,我们都会猜谁会获得冠军.假设有32支球队,编号从1-32.然后问:“冠军是在1-16中吗?”,不是的话就是在6-32中,一次类推.我们最多需要猜测5次就能猜出谁是冠军(log32).但事实上,我们可能不需要5次就能猜出来,因为像巴西,德国,意大利这样的强队获得冠军的可能性比其他的要高.然后分组的时候,把少数几支强队放在一组.,以此类推,就不需要5次就能算出来.香农不用次,而是用“比特”(Bit)这个概念来衡量信息量.他指出,以

凯利公式的模拟验证

凯利公式的模拟验证场景:一个赌局,你跟庄家.你出 1 元,庄家出 0.96元.赌金数目可随之翻倍. 根据每次抛色子的结果的单双决定胜负. 胜者得到双方所下的赌金,计 1.96 元. 问题:如何下注才能做到,风险最小,盈利最大呢? 答案:凯利公式. 凯利公式的作用: 根据赔率与胜率,得出你每次的资金下注比例公式的两种形式: 公式:(期望报酬率)/(赔率) 公式:(盈利概率×盈利金额-亏损概率×亏损额)/(盈利额 / 亏损额) 凯利公式最初为 AT&T 贝尔实验室物理学家约翰·拉里·

决策树之信息与熵的计算

一.引言之前提到的k-近邻算法是分类数据最简单最有效的算法.k-近邻算法是基于实例的学习,使用算法时我们必须有接近实际数据的训练样本数据.而且,k-近邻数据必须保全全部数据集,如果训练数据集的很大,必须使用大量的存储空间,此外k-近邻算法必须对数据集中的每个数据计算距离,这是非常耗时的.另外,对于数据的基础结构信息,它也是无能为力的. 另一种分类算法就是“决策树算法”.对待一个数据,决策树使用多个决策判断确定最终的分类,举个小例子说明一下:给定一个动物,判断什么动物的分类,首先“它是哺乳类动物

硬件开源为什么如此之难？

硬件开源为什么如此之难? 2015-10-01 16:31 原创喵酱 4条评论 [编者按]本文来自知乎,由作者@Dee ne 授权转载. 开源硬件会像开源软件给软件业带来的影响那样,也给硬件相关技术(以及硬件团队自身)带来巨大发展吗?这也许是每一个硬件工程师(当然也包括软件工程师)都会思考的问题.硬件与软件毕竟不一样,本文主要从硬件开源与软件开源的区别的角度,来简单说说硬件开源为什么那么难. 首先我们要明确的是:硬件的开源工作远远要比软件复杂. 为什么呢?因为硬件工程相对于软件工程而言,有着以

读书笔记：计算机网络第二章：物理层

这是我在Coursera上的学习笔记.课程名称为<Computer Networks>,出自University of Washington. 由于计算机网络才诞生不久,目前正在以高速在发展,所以有些旧的教材可能都已经跟不上时代了.这门课程在2013年左右录制,知识相对还是比较新的.覆盖了计算机网络中的各个协议层,从物理层到应用层都讲得非常仔细.学完这门课程之后对计算机网络会有比较深刻的了解. 本章详细讲解了物理层,讲解了比特流如何通过各种介质进行传播. 基本概述物理层的功能专注比特信号是

重新认识数据

误入数据分析行业已有5年多,由于并非"科班"专业毕业,自己从编程到统计理论基础,从简单线性回归到SVM.GBDT.LSTM等复杂算法一路跌跌撞撞学习过来,蓦然回首,才发现做了这么久的数据分析.数据挖掘.大数据等,却没有系统地思考过"数据"这一最基础的要素的确切含义和特性.而所有行业中,基础要素的概念和特性,无疑都是武侠中的"气宗"之本,决定了最终修为的境界高低.回忆所学,似乎也没有哪本书专门讲过"数据"本身,大概大家都对这个词

辛东方：人工智能究竟离我们还有多远？

科技的发展,让人类社会步入一个高速前进的智能圈子.人工智能的出现,根本上促进了技术的革新.新产能.新工具也因为人工智能的出现变得更加激动灵活.人工智能的出现,是否说明它真正对人类社会产生巨大的变化,或者说仅仅是一个开始? 文/辛东方(80后作家.专栏作者.专注互联网科技领域) "人工智能"一词最早出现在1956年,距今已有60年时间了.1956年,包括约翰·麦肯锡.马文·明斯基.克劳德香农(信息论创立者)在内的数十位数学家.计算机学家在达特茅斯召开了两个月的学术会议,会议的主题是:用机

猜你喜欢

find 命令概览

Linux下find命令在目录结构中搜索文件,并执行指定的操作.Linux下find命令提供了相当多的查找条件,功能很强大.由于find具有强大的功能,所以它的选项也很多,其中大部分选项都值得我们花时 ...

iopuipihpd5tydu

http://www.ebay.com/cln/ggziqllmgbr/-/173340286018/20150205html http://www.ebay.com/cln/kuazlidhv ...

【搜索引擎基础知识1】搜索引擎基本架构

(一)搜索引擎的开发一般可分为下面三大部分 1.数据採集层:一般使用爬虫获取互联网的数据,重要的开源项目有Heritrxi 2.数据分析处理层:将从互联网上获取到的数据进行提取归类.分词.语义分析得出 ...

笔记本找不到摄像头设备的解决办法

今天跟家里聊天呢,摄像头怎么也打不,于是很纳闷本来是想着隐私里面的关了,进去一看,是在开着的又想到是驱动问题,用驱动精灵,和360弄了好大一会,还是不行 ..................... ...

微信零钱和微信信用卡还款功能来临了

微信近阶段可谓动作频频,微信小店.搜狗微信搜索.封禁微信集赞,13日发公告称腾讯旗下财付通公司已于4号将原名“深圳市财付通科技有限公司”正式变更为“深圳市财付通支付科技有限公司”.底层则基于腾讯财付通 ...

用iOS 做一个简易计算器 (功能完备)

源码(.m文件) #import "ZKJAppDelegate.h" @interface ZKJAppDelegate () @property (retain,nonatom ...

多线程设置属性引发的崩溃问题

多线程同时存和取公共变量容易导致崩溃,这个很好理解.那么只是同时调用普通的setter方法呢? ARC环境测试代码如下,变量都是@property属性对setter方法进行加锁就可以避免崩溃 MRC ...

Html5游戏框架createJs组件--EaselJS(二)绘图类graphics

有端友问我是否有文档,有确实有,但没有中文的,只有英文的,先提供浏览地址供大家参考学习createJs英文文档. EaselJS其实主要就是createJ ...

jmeter进行的接口测试和压力测试

1.接口测试接口测试的内容我们之前已经讲过,values-key形式和json串传参形式: 包括的协议有http,webservice(soap),jdbc数据库,java请求 2.参数化定义:把 ...

粤镁瞧行依bi9906ktvj097z

新华社瓦莱塔4月10日电(记者李拯宇李佳)全国政协主席俞正声10日在前往非洲三国进行正式友好访问途中过境马耳他,在瓦莱塔会见马耳他议长法鲁贾. 俞正声说,中马保持长期友好关系,政治上相互信任,经济上 ...

java uuid 随机生成唯一序列号

UUID(Universally Unique Identifier)全局唯一标识符,是指在一台机器上生成的数字,它保证对在同一时空中的所有机器都是唯一的.按照开放软件基金会(OSF)制定的标准计算, ...

HDU4930 Fighting the Landlords 模拟

Fighting the Landlords Fighting the Landlords Time Limit: 2000/1000 MS (Java/Others) Memory Limit ...

常用的Java Date 方法

常用的Java Date 方法 1.计算某一月份的最大天数: Calendar time=Calendar.getInstance(); time.clear(); time.set(Calendar ...

安卓开发-Activity中finish() onDestroy() 和System.exit()的区别（转）

Activity.finish()Call this when your activity is done and should be closed. 在你的activity动作完成的时候,或者Act ...

使用autossh实现开机创建ssh tunnel的方法以及shell脚本.

有时候回需要到ssh tunnel,手动使用ssh 创建这些并没有太大的问题,可是如果尝试开机启动,写个shell脚本并在rc.local里面运行这个脚本并不成功,原因也不得而知. 后来发现了auto ...

OpenMP初步（英文）

Beginning OpenMP OpenMP provides a straight-forward interface to write software that can use multipl ...

C#_观察者模式

假设有一个软件公司,每当有新产品推出,就把信息通知到一些客户. 把通知这个动作抽象成一个接口. public interface IService { void Notif(); } 客户如果想获得通 ...

移动端默认兼容各手机比例

<script type="text/javascript" src="http://js.40017.cn/cn/min/??/cn/f/touch/Script ...

PLSQL 的简单命令之三

-- 查找两个表中ID相等的 select a.id, a.name,b.math from stu a,scores b where a.id = b.id -- 右外连接 select b.id, ...

【BZOJ3894】文理分科最小割 (再不刷它就土了，毕竟水题)

#include <stdio.h> int main() { puts("转载请注明出处[vmurder]谢谢"); puts("网址:blog.csdn. ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.024 s.