「02」《机器学习经·天工开物篇》

上期导读:机器学习,到底在学些什么?


起源

故事要从上古神器差分机说起。

从古至今,所有的算法修炼和真气推演记录,全部要靠门派里的外门弟子手写,工序繁杂不说,还耗时良久,导致各大门派的修炼进度一直提不上来。

直到两百年前,神器大师查尔斯·巴贝奇开始了差分机的设计和制造,在后续大师的不断改良之后,终于实现了从真气计算到密文印刷的过程全部自动化,这样还可以避免人为误差,在那个时候,这是一个非常开创性的想法。

?

差分机使用有限差分法来机器计算多项式函数(一种真气运转模式)的值。有限差分方法是个简单但功能强大的技巧,它用重复加减的过程来避免需要的乘法和除法。由于当时制造工艺水平较低,这个 10 英尺高,10 英尺宽,5 英尺长,重 2 吨,以蒸汽机驱动的庞然大物在 10 年间只完成了七分之一。

?

在分析机之后,在1847~1849 年间巴贝奇运用在开发过程中得到的心得,重新设计了差分机2号。它可以计算到 31 位数及第7阶差,而且零件数还只有差分机1号的 1/3。

可惜的是,这时候巴贝奇已经找不到愿意出资的修炼门派了,因此差分机2号也只停留在了纸面上。巴贝奇穷其一生研究设计差分机,多么复杂的机械工程,在那个年代就可以代替人工进行计算,足可以称得上早期修真炼器史上的巅峰之作。

电子计算机的产生

延续了巴贝奇的理念,很快便有修真门派发展了一种以电属性真气驱动的法宝,称之为“电子计算机”。而随着电子计算机的发展,一种叫做人工智能的修炼范畴论发展也在悄然进行。

在巴贝奇炼制出差分机之后的100年,一位名叫图灵的真气研究员发表了题为《论数字计算在决断难题中的应用》的修炼讲义,他描述了一种可以辅助真气运行、推演的模式,后来被人称为“图灵机”,第一次在纯修真的符号逻辑和实体世界之间建立了联系。后来我们所熟知的气海雪山,就是基于这个设想。

十四年后,图灵发表《机器能思考吗》这一划时代的作品,提出了真气自动运行模式,修真界震动,后来,图灵被尊为“修真宗师”。

自此,新的时代开始,后世称为“新时代”

新时代

根据图灵宗师的修炼理论,新时代算法修炼者的修炼方法产生了天翻地覆的变化。

曾经的修炼者,在修炼时需要每时每刻关注着体内真气的运行,小周天走完走大周天,一个不慎就是真气错位,错位多了甚至有可能走火入魔。

这就是说,修炼时必须心无旁骛,无人打扰,且除了盯着体内真气运转,别的啥事都干不成,这样一来效率自然低下。先不说真气数量随着修炼越来越庞大,光是每天在洞府里闭关,人的心态都会出问题,修炼界有不少疯子就是这么来的。

图灵宗师提出的“人工智能”论,则是让体内经脉构造气海雪山,自行学习真气的运转模式、修炼规律,在修真者人为的引导几次之后,可以自行记住运行的模式,并且不需要时刻关注,只需要吸纳不同真气,就能在体内运转,极为方便。修炼者可以一心多用,24小时修炼,还能做别的事情,比如炼丹,炼器,和同门师妹侃大山等等。

人们给图灵宗师的评价就是  “解放双手,逍遥御风”

?

再到后来,修炼界人才辈出,迎来百花齐放的年代。就说当代,最出名的得数Geoffrey Hinton,深度学习派开山掌门,其门派擅长炼丹,丹方在炼丹界是个话题,却一直秘而不宣,隔壁的统计学派怀疑他们炼的丹都是歪打正着弄出来的,但修炼界的人士并不当真,因为丹药确实好用。服用丹药,可以构建新的运行模式,气海越发深厚,加速真气修炼。

其次,便是深度学习派首席长老Yann LeCun,创立“卷积”修炼法,使得气海雪山识别物体、文字的速度大大加快,效果也更好。关于这个门派的更多故事,以及修炼方法,会在另一篇《深度学习经》中详谈,此处略过。

修炼境界

筑基期:修炼者须熟练掌握线性代数、概率统计与微积分三大修行法门

分类期:修炼者需要让体内的气海雪山掌握将真气分门别类的功能,在不同经脉周天中运转

回归期:基于分类期的修炼基础,进一步将更高等级的真气(带数值)划分到更细微的脉、窍之中

聚类期:经过分类,各个真气分子通过红细胞运送到身体各处,构成经脉小周天。要突破金丹期,需要将气海雪山上的离散小元气聚合成具有高密度、内聚性的团,这就叫金丹。

集成期:目前江湖上各大门派最常见的境界,其实施简单也兼容其他功法,基于《分类篇》决策树所衍生

图论期:元神以各个节点组成周天图,可完整游走周天图,学习整体运行模式,有概率图模型、有向图、无向图

修炼功法

《筑基要讲》:修真界广为流传,内容有线代、微积分、概率统计,之后会穿插讲解,也可以提前针对性地学习

《机器学习经》:每一篇对应上面的修炼境界,基于筑基期的知识,可以有效、快速地进行修炼提升

《机器学习经·概念篇》:对于无监督、有监督、半监督等基础概念进行讲解

《模型真诀》:必读法术,主要讲气海雪山判别的准确率,召回率。以及交叉验证、周天评估、真气选择、泛化等。其中,泛化是指气海中的模型对于从未见过的真气,比如这个月门派从深度学习宗那边新进了一批跟以前不同的丹药。如果泛化能力弱的气海雪山修炼者,就很容易判断错误,七窍流血。

《降维天书》:主要讲真气的降维方法、特征的选择等,如主成分分析、线性判别分析

《优化术》:术法是修炼界每位算法修士必须修炼的,否则修炼途中只知道干什么,却没法调动真气运行。只有精通优化术,才能更好的减少气海的判断误差,减少走火入魔的几率,在体内自成小系统。最著名的优化术叫做随机梯度下降

《信息箓》:香农真人为大家介绍了天地中存在的信息、信息熵、KL散度等

知识对应

高等数学 = 筑基

数学知识补充 = 炼体

气海雪山 = 模型

训练数据 = 内部真气(用来引导循环小周天)

标签 = 真气类别,如最常见的金木水火土

特征 = 真气属性,比如铀、铯

测试数据 = 外来真气

验证集 = 一部分循环过的真气,用来鉴定气海雪山

学习 = 自动化进行真气吐纳修炼的过程

下一篇,主角正式踏上算法修炼之路,且看一个无名小卒如何一步步修炼成修真大佬~欢迎关注下一篇《《机器学习经·筑基篇》

?

任何关于算法、编程、AI行业知识或博客内容的问题,可以随时扫码关注公众号「图灵的猫」,加入”学习小组“,沙雕博主在线答疑~此外,公众号内还有更多AI、算法、编程和大数据知识分享,以及免费的节点和学习资料。其他平台(知乎/CSDN/B站)也是同名「图灵的猫」,不要迷路哦~

「02」《机器学习经·天工开物篇》

原文地址:https://www.cnblogs.com/y1ran/p/12124094.html

时间: 2024-10-08 16:33:05

「02」《机器学习经·天工开物篇》的相关文章

「01」机器学习,到底在学些什么?

阅读 0 编辑文章 大家好,欢迎来到久违的机器学习系列,这是「美团」算法工程师带你入门机器学习 专栏的第一篇文章,不会太长,一半聊想法,一半聊干货.熟悉我的朋友可能知道,我以前的文章比较随意,涉及的内容极广,包括但不限于Python/Java/C/C++,网络编程,Hadoop等,但主要核心还是机器学习算法和数据科学相关的主题,这一点没变过. 最近认真总结和思考了之前的博客内容,决定将自己从入门到现在一路走来的学习经验和理解整理一番,帮助更多后来的小伙伴更好的入门,所以就有了这个系列.以前的知乎

「03」机器学习、深度学习该怎样入门?

我本科是个和计算机.数学毫不相关的人文类专业,后来用了大三.大四两年时间,从中学级别的数学捡起,一路自学.实习.读研到现在.我太熟悉入门时候的坑了,直接从一大堆概念.公式.书单入手,谁看谁懵. 所谓入门,绝不是粘课程链接.讲概念定义.有些答案确实解释的非常通俗,但这不叫入门. 古语说入门,就一句话 师傅领进门,修行在个人 所以我不会随便复制粘贴一些高分书目,或者讲讲什么是深度学习.我希望能从一个不一样的角度来回答该如何入门深度学习,希望可以授人与渔,教教大家入门的方法论. 对于自学成分居多.想转

分布式系统「伸缩性」大招之——「水平&垂直切分」详解

如果第二次看到我的文章,欢迎右侧扫码订阅我哟~  ?? 本文长度为5389字,建议阅读14分钟. 坚持原创,每一篇都是用心之作- 没想到这篇文章写了这么长,一时半会没消化完的话,可以收藏一下先. 这是「伸缩性」章节的第四篇,先给新来的小伙伴们简单回顾下前三篇的内容. 做「伸缩性」最重要的就是先做好「无状态」,如此才可以随心所欲的进行横向“扩展”,而不用担心在多个副本之间切换会产生错乱.<分布式系统关注点——「无状态」详解>聊的就是这个. 不过,就算做好了横向扩展,本质上还是一个“大程序”,只是

【翻译】西川善司的「实验做出的游戏图形」「GUILTY GEAR Xrd -SIGN-」中实现的「纯卡通动画的实时3D图形」的秘密,后篇

http://www.4gamer.net/games/216/G021678/20140714079/ 连载第2回的本回,  Arc System Works开发的格斗游戏「GUILTY GEAR Xrd -SIGN-」解说的后篇送到了.前篇的最后预告的那样,本回,是只能看到Anime的3D图形的2D格斗游戏产生所采用的细小方法为中心的介绍. 变形的几何体,替换几何体 GUILTY GEAR Xrd -SIGN-的图形,看上去是Cel Anime风格,并不是什么都采用Toon Shader.这

【翻译】西川善司「实验做出的游戏图形」「GUILTY GEAR Xrd -SIGN-」中实现的「纯卡通动画的实时3D图形」的秘密,前篇(1)

http://www.4gamer.net/games/216/G021678/20140703095/ 新连载「实验做出的游戏图形」,是聚焦在特定游戏的图形上, 对它的结构和使用的技术解说为主旨.之前笔者连载的「西川善司的3D游戏入迷」,覆盖范围都很广,而与特定游戏强关联的技术解说,会在今后的新连载中处理. 作为纪念的第一回选择的,是Arc System Works开发的,2014年2月在街机上运作的格斗游戏「GUILTY GEAR Xrd -SIGN-」 全3D图形的GUILTY GEAR

大数据和「数据挖掘」是何关系?---来自知乎

知乎用户,互联网 244 人赞同 在我读数据挖掘方向研究生的时候:如果要描述数据量非常大,我们用Massive Data(海量数据)如果要描述数据非常多样,我们用Heterogeneous Data(异构数据)如果要描述数据既多样,又量大,我们用Massive Heterogeneous Data(海量异构数据)--如果要申请基金忽悠一笔钱,我们用Big Data(大数据) 编辑于 2014-02-2817 条评论感谢 收藏没有帮助举报作者保留权利 刘知远,NLPer 4 人赞同 我觉得 大数据

零元学Expression Blend 4 - Chapter 11 用实例了解布局容器系列-「Border」

原文:零元学Expression Blend 4 - Chapter 11 用实例了解布局容器系列-「Border」 将教大家以实做案例认识Blend 4 的布局容器,此章介绍的布局容器是Blend 4 里的专情王子-「Border」. ? ? 本系列将教大家以实做案例认识Blend 4 的布局容器,此章介绍的布局容器是Blend 4 里的专情王子-「Border」. ? ? 就是要让不会的新手都看的懂! ? <专情王子?查理B> Border是Blend里最简单的布局容器,可以使用Borde

零元学Expression Blend 4 - Chapter 15 用实例了解互动控制项「Button」I

原文:零元学Expression Blend 4 - Chapter 15 用实例了解互动控制项「Button」I 本章将教大家如何更改Button的预设Template,以及如何在Button内设置动画. ? 本章将教大家如何更改Button的预设Template,以及如何在Button内设置动画. ? ? ? 01 开启一个新专案,并且置入一个Button,调整到适当大小 ? 在Properties->可以调整Button的外观,基本设定都跟先前的教学雷同 不熟的人请看如何用Blend制作一

零元学Expression Blend 4 - Chapter 8 用实例了解布局容器系列-「Grid」

原文:零元学Expression Blend 4 - Chapter 8 用实例了解布局容器系列-「Grid」 本系列将教大家以实做案例认识Blend 4 的布局容器,此章介绍的是Blend 4 里的布局容器大哥-「Grid」. ? 本系列将教大家以实做案例认识Blend 4 的布局容器,此章介绍的是Blend 4 里的布局容器大哥-「Grid」. ? ? ? 就是要让不会的新手都看的懂! ? ? ? <实至名归的容器大哥> Blend 4内的容器有很多种,比较常运用到的除了有Grid.Can