内容简介
几年前,“数学之美”系列文章原刊载于谷歌黑板报,获得上百万次点击,得到读者高度评价。读者说,读了“数学之美”,才发现大学时学的数学知识,比如马尔可夫链、矩阵计算,甚至余弦函数原来都如此亲切,并且栩栩如生,才发现自然语言和信息处理这么有趣。
在纸本书的创作中,作者吴军博士几乎把所有文章都重写了一遍,为的是把高深的数学原理讲得更加通俗易懂,让非专业读者也能领略数学的魅力。读者通过具体的例子学到的是思考问题的方式 —— 如何化繁为简,如何用数学去解决工程问题,如何跳出固有思维不断去思考创新。第二版增加了针对大数据和机器学习的内容,以便满足人们对当下技术的学习需求;同时,根据专家和读者的反馈更正了一些错漏,并更新了部分内容。
《数学之美》第一版荣获国家图书馆第八届文津图书奖;
入选广电总局“2014年向全国青少年推荐百种优秀图书书目”;
荣获2012-2013年度全行业优秀畅销书;
《浪潮之巅》、《文明之光》作者吴军博士最新力作,李开复作序推荐,Google黑板报百万点击!
新版增加了大数据和机器学习等最新内容,以满足人们对当下技术的学习需求;同时,根据专家和读者的反馈更正了错漏,并更新了部分内容。
作者简介
吴军博士,毕业于清华大学和美国约翰·霍普金斯大学,是著名自然语言处理和搜索专家,硅谷风险投资人。获奖畅销书《浪潮之巅》及《数学之美》的作者。
吴军博士是谷歌公司早期员工之一。在谷歌,他和辛格(美国工程院院士,世界著名搜索专家)、Matt Cutts(谷歌反作弊官方发言人)等三位同事一起开创了网络搜索反作弊的研究领域,并因此获得谷歌工程奖。2003年,他和谷歌全球架构的总工程师朱会灿博士等共同成立了中日韩文搜索部门。吴军博士是当前谷歌中日韩文搜索算法的主要设计者。在谷歌期间,他还领导了许多研发项目,得到了当时公司首席执行官埃里克·施密特和创始人谢尔盖·布林的高度评价。
2010年—2012年,他×××腾讯公司,出任负责搜索和搜索广告的副总裁,同时担任国家重大专项“新一代搜索引擎和浏览器”项目的总负责人。2012年回到谷歌,负责开发了被认为是“下一代搜索”的谷歌自动问答系统。同年,他作为创始合伙人共同创立了中关村硅谷风险投资基金(ZPark Venture)。
目录
第一版读者赞誉
第二版出版说明
第一版序言
第二版序言
第二版前言
第1章 文字和语言vs数字和信息
1 信息
2 文字和数字
3 文字和语言背后的数学
4 小结
第2章 自然语言处理——从规则到统计
1 机器智能
2 从规则到统计
3 小结
第3章 统计语言模型
1 用数学的方法描述语言规律
2 延伸阅读:统计语言模型的工程诀窍
3 小结
第4章 谈谈分词
1 中文分词方法的演变
2 延伸阅读:如何衡量分词的结果
3 小结
第5章 隐含马尔可夫模型
1 通信模型
2 隐含马尔可夫模型
3 延伸阅读:隐含马尔可夫模型的训练
4 小结
第6章 信息的度量和作用
1 信息熵
2 信息的作用
3 互信息
4 延伸阅读:相对熵
5 小结
第7章 贾里尼克和现代语言处理
1 早年生活
2 从水门事件到莫妮卡·莱温斯基
3 一位老人的奇迹
第8章 简单之美——布尔代数和搜索引擎
1 布尔代数
2 索引
3 小结
第9章 图论和网络爬虫
1 图论
2 网络爬虫
3 延伸阅读:图论的两点补充说明
4 小结
第10章 PageRank——Google的民主表决式网页排名技术
1 PageRank 算法的原理
2 延伸阅读:PageRank的计算方法
3 小结
第11章 如何确定网页和查询的相关性
1 搜索关键词权重的科学度?
2 延伸阅读:TF-IDF的信息论依据
3 小结
第12章 有限状态机和动态规划——地图与本地搜索的核心技术
1 地址分析和有限状态机
2 全球导航和动态规划
3 延伸阅读:有限状态传感器
4 小结
第13章 Google AK-47的设计者——阿米特·辛格博士
第14章 余弦定理和新闻的分类
1 新闻的特征向量
2 向量距离的度量
3 延伸阅读:计算向量余弦的技巧
4 小结
第15章 矩阵运算和文本处理中的两个分类问题
1 文本和词汇的矩阵
2 延伸阅读:奇异值分解的方法和应用场景
3 小结
第16章 信息指纹及其应用
1 信息指纹
2 信息指纹的用途
3 延伸阅读:信息指纹的重复性和相似哈希
4 小结
第17章 由电视剧《暗算》所想到的——谈谈密码学的数学原理
1 密码学的自发时代
2 信息论时代的密码学
3 小结
第18章 闪光的不一定是金子——谈谈搜索引擎反作弊问题和搜索结果的权威性问题
1 搜索引擎的反作弊
2 搜索结果的权威性
3 小结
第19章 谈谈数学模型的重要性
第20章 不要把鸡蛋放到一个篮子里——谈谈最大熵模型
1 最大熵原理和最大熵模型
2 延伸阅读:最大熵模型的训练
3 小结
第21章 拼音输入法的数学原理
1 输入法与编码
2 输入一个汉字需要敲多少个键——谈谈香农第一定理
3 拼音转汉字的算法
4 延伸阅读:个性化的语言模型
5 小结
第22章 自然语言处理的教父马库斯和他的优秀弟子们
1 教父马库斯
2 从宾夕法尼亚大学走出的精英们
第23章 布隆过滤器
1 布隆过滤器的原理
2 延伸阅读:布隆过滤器的误识别问题
3 小结
第24章 马尔可夫链的扩展——贝叶斯网络
1 贝叶斯网络
2 贝叶斯网络在词分类中的应用
3 延伸阅读:贝叶斯网络的训练
4 小结
第25章 条件随机场、文法分析及其他
1 文法分析——计算机算法的演变
2 条件随机场
3 条件随机场在其他领域的应用
4 小结
第26章 维特比和他的维特比算法
1 维特比算法
2 CDMA技术——3G移动通信的基础
3 小结
第27章 上帝的算法——期望最大化算法
1 文本的自收敛分类
2 延伸阅读:期望最大化和收敛的必然性
3 小结
第28章 逻辑回归和搜索广告
1 搜索广告的发展
2 逻辑回归模型
3 小结
第29章 各个击破算法和Google云计算的基础
1 分治算法的原理
2 从分治算法到Ma
3 小结
第30章 Google大脑和人工神经网络
1 人工神经网络
2 训练人工神经网络
3 人工神经网络与贝叶斯网络的关系
4 延伸阅读:Google大脑
5 小结
第31章 大数据的威力——谈谈数据的重要性
1 数据的重要性
2 数据的统计和信息技术
3 为什么需要大数据
4 小结
附录 计算复杂度
第二版后记
索引
如果想得到下载地址,请微信搜索关注“中科院计算所培训中心”公众号,添加中科院计算所培训中心助教“zhongkeyuanjss666”,帮助进入中科院计算所IT技术分享群,群里有地址分享。
原文地址:https://blog.51cto.com/14242083/2418081