【零基础】看懂“深度学习”的优势

  深度学习是AI研究的一个重要方向,最近看了不少相关资料,不免有些感悟这里写出来给大家分享。

一、深度学习是基础服务

  深度学习可以类比于云计算,很多人看不懂、看不明白,只知道好像很厉害。其实与当年的云计算有点类似,喧嚣和泡沫过后,现在回看云计算的本质其实就是“基础服务”。这个基础服务是整个社会的一次升级,阿里云诞生于2009年,也正是第三次互联网浪潮的元年。

  云计算诞生之前,一个企业要提供某项互联网服务要做什么?

  1)买服务器

  2)买专线

  3)开发软件

  4)寻找客户

  云计算诞生之后呢?考虑商业模式就行了,因为前面所有步骤都可以直接买到,甚至有非常成熟的方案提供。

  1)服务器:各种云可以租虚拟主机,一个月最低30-40元

  2)专线:虚拟主机送公网IP

  3)开发软件:各行各业都可以直接买到SAAS服务,一键定制你的APP、网站、办公系统、财务软件等等,费用最低99元/月

  4)寻找客户:各大平台一键营销,精准广告投放

  最重要的是,所有这些关键要素都统一在一个“云”平台上,创业者只需要考虑好自己的商业模式能不能挣钱就行了。所以09年以后,大家普遍感觉创业的人更多了,许多人一夜暴富,但是更多人感觉干啥都挣不到钱,因为互联网“门槛”太低了!

  一个小店想接入APP点餐、在线支付、甚至是同城营销,以前最低50万起步,代码修修改改上线得一年。现在呢?上阿里云点几下,一个月99全部搞定!这就是整个社会的基础服务升级。然后我们就发现,更多的创业者都在“模式创新”,因为基础设施已经太完善了,可以说云计算的普及不亚于高铁的成就!

  我们再看看“深度学习”,现在能看到的应用不外乎就是PP图、模仿声音、图片识别等等,实际上大部分人没看到的是它的“跨界属性”。09年之前我们可以将卖云吞的小老板与互联网关联起来吗?现在可以了,你进了一家小店,微信扫一下,从点单、买单、上菜全部小程序搞定,老板只需要做好云吞就行了,这就是基础服务升级的魅力。

  现在你能将“深度学习”与这个云吞店关联起来吗?恐怕不能。那我们设想这样一个场景:你走到云吞店门口,犹豫是要吃云吞呢还是隔壁的小面,就在这时,AI通过走路的姿势和眼神判断你可能是潜在新客户并且在犹豫,立即在门口的大屏幕上显示“新客立减5元”,我想很多人是阻挡不了这种优惠的。那云吞老板说了,我可以挂个招牌写上撒。如果这时候是个老客户呢,一看新客优惠老客户没优惠啦,是不是人家要去吃隔壁小面了。AI来处理就好办了,一看是胖子,屏幕上立即显示云吞个头大、虾量足、今天加量还有优惠。一看是瘦子,屏幕就显示荠菜云吞健康好吃,小份的只要10元。等等,这不就是个高级营销嘛?是的,AI这时就是实现了高级营销。那店老板做下营销研究,在后台设置一些参数来识别新老客户,并且有针对性地写一些营销方案行不行呢?自然是可以的。但是换个店怎么办?卖小面的是不是要重新做一下研究重新制订方案呢?卖水饺呢?是不是所有店老板都得是营销专家才行啊。

  有了云计算小店老板不用编程一样接入互联网,同样的,有了深度学习小店老板不懂营销一样是营销大师。而且深度学习的关键魅力在于,它不需要任何的营销知识,只需要通过学习和自我迭代就能变成你的专属营销专家,这就要从深度学习的基本原理讲起了。

二、深度学习的基本原理

  深度学习与机器学习的最大区别在于,学习过程中是不需要有“人”的,也就是它能自我迭代和进化,很神奇吗?其实还好,下面我们详细讲讲。

  

  上图是身高与体重对应的统计图,红色是女性,蓝色是男性。可以看到身高与体重大体是正相关的,也就是身高越高体重越重。机器学习的办法就是录入大量的身高体重数据,然后去除“噪音”,做一些加权运算最终得到一个大体合理的预测模型,如下图:

  这个模型自然是有一点合理性,但是基本没有实用意义,因为“特征”太少。

  下图是一个风暴预测图,科学家发现风暴的形成与温度、湿度可能有一定相关性,于是他们把大量历史数据输入到机器学习的模型里,最后得到温湿度与风暴形成的数学模型,以后使用时只需要输入当前温湿度就能得到风暴形成的概率值。这里的温度和湿度就是这个模型的“特征”。

  前面例子的核心问题就是,必须得有个科学家来输入“特征”,而且特征越多模型也就越准确,那么一个模型是否准确的关键就在于特征是否足够、数据量是否充足,还得有个“科学家”来寻找和输入特征。一个模型的成功与否与人的经验其实是正相关的。

  到了深度学习神奇的事情就发生了,我们只需要数据量而无需输入特征,因为它自己给自己把特征找出来了!我们以人像识别(从多张图片中识别出包含人脸的图片)为例简单讲一下原理,下图比较经典了,大概描述了深度学习的基本过程,但是很多人看的有点糊涂,这里我们就详细解释下。

  第一张图:即是要学习的图片

  第二张图:深度学习先从图片中提取出各种“边”,即有明暗变化的部分。这里叫第一层特征

  第三张图:将各种“边”进行随机组合,能得到眼睛、鼻子、耳朵。这叫第二层特征

  第四张图:将上面的眼睛、鼻子、耳朵再次进行组合,即能得到看起来像是人脸的图片。这叫第三层特征

  如果输入足够多的图片,我们就能得到足够充分的特征库(保留各层相似的,去掉各层不相似的)。如此,当你胡乱输入一些图片时,AI通过特征库就能判断那些是人脸那些不是了。深度学习的厉害之处就在于特征库的学习完全是自主实现的,而机器学习需要人为去输入这些特征。深度学习的“深度”之处就在于你可以使用更多层次,提取更加精准的特征,最终的效果就是人脸识别、随机人脸生成、无缝PS等等。

三、深度学习的优势

  综上,深度学习的优势就在于它摆脱了经验与“专家”,无论什么人只要掌握了该技术就变得比行业专家还要专家。比较实际的应用就包括:

  1)一键换头,不会PS也能变成PS神人

  2)一键去除背景,同上

  3)模仿特定声音,人人都是调音师

  4)随机生成猫图,天天吸猫不是梦

  这些软件的创作者都不是相关专家,大部分还都是这个研究方向的学生。相信很快就会有通用的平台让每个人都可以“深度学习”起来。

  AI大势已来,关注公众号“零基础爱学习”,我们以后会推送更多“零基础”文章,一定要关注啊!

原文地址:https://www.cnblogs.com/cation/p/11381276.html

时间: 2024-08-01 20:28:34

【零基础】看懂“深度学习”的优势的相关文章

零基础搞懂智能机之手机参数怎么看

欢迎转载opendevkit文章, 文章原始地址: http://www.opendevkit.com/?e=53 手机参数, 基本能反映一款机器到底好还是不好.本篇带领大家阅读Samsung Galaxy S5的参数, 让大家购机心里有底. 这里要提醒: 不是硬件参数好, 系统体验就一定好的.当然好的软件, 要用好的硬件支撑. 笔者觉得, 参数差不多就好, 外形, UI, 发热, 安全性比较重要. 曝光日期 2014年 手机类型 4G手机,3G手机,智能手机,拍照手机,平板手机 运营商定制 中

准零基础搞懂FFT快速傅里叶变换及其实现程序(二)

上一篇文章我们了解了DFT的原理,FFT是基于DFT的更适合计算机运算的算法,本文我们就正式开始学习FFT的原理. 首先我么先来宏观的看一下FFT.如果我们把整个FFT的算法看成一个黑盒子的话,那么它的输入就是时间波形信号,比如声音波形(横轴为时间,纵轴为振幅).外什么FFT要比DFT速度更快呢?下面(图1)解释了FFT和DFT的(对于计算机的)算法复杂度 图1 从上面的数学表达式可以看出,一个1024采样点的FFT比DFT块了102.4倍.如果傅里叶变换的数量级更大,FFT的速度优势会更明显.

一天搞懂深度学习--李宏毅教程分享

原标题:[286页干货]一天搞懂深度学习(台湾资料科学年会课程) 本文是2016 台湾资料科学年会前导课程"一天搞懂深度学习"的全部讲义PPT(共268页),由台湾大学电机工程学助理教授李宏毅主讲.作者在文中分四个部分对神经网络的原理.目前存在形态以及未来的发展进行了介绍.深度学习的每一个核心概念在文中都有相关案例进行呈现,通俗易懂.一天的时间搞懂深度学习?其实并不是没有可能. 深度学习 ( Deep Learning ) 是机器学习 ( Machine Learning ) 中近年来

零基础学Python应该学习哪些入门知识及学习步骤安排

众所周知,Python以优雅.简洁著称,入行门槛低,可以从事Linux运维.Python Web网站工程师.Python自动化测试.数据分析.人工智能等职位,薪资待遇呈上涨趋势.很多人都想学习Python,那么零基础学Python应该学习哪些入门知识呢? Python入门知识一:解释器. Python是一种面向对象的解释型计算机程序设计语言,因此想要学好Python你必须要了解解释器.由于Python语言从规范到解释器都是开源的,所以理论上,只要水平够高,任何人都可以编写Python解释器来执行

教你从零基础小白开始怎么学习C语言

想窥探神秘的代码世界?最好的入口无疑就是C语言. C语言是计算机体系结构的基础,向下可以操作硬件(包括ARM,DSP,单片机等各种微处理器),还可以写驱动,写OS,写编译器.向上可以进一步的学习C++,JAVA等面向对象语言,再学习一些图形用户界面框架,比如Qt,MFC,就可做出类似于计算器.QQ等Window桌面应用,再比如Android,就可以做出微信等Android应用,再比如Unity3D,就可以做出类似王者荣耀.刺激战场等手游.想想是不是就有点小激动呢!最后,如果大家如果在自学遇到困难

C语言零基础项目驱动式学习第四天

//类型修饰符  数组名[数组元素个数] = {初始化}; //定义数组的时候[]中必须是常量表达式, 不可以是变量; /* int age[5] = {21, 18, 25, 20, 18}; int array[10] = {0};//代表数组中有10个元素, 每个都是0; int array1[8] = {1};//代表数组中有8个元素,第一个是1,其余的为0; int age2[2 + 3] = {0}; */ //定义数组和使用数组的最大区别是, 前面是否有类型修饰符 //使用数组元素

C语言零基础项目驱动式学习第二天

//BOOL 类型是一种非真即假的数据类型,取值只有YES和NO, //BOOL 其实是OC中得数据类型,在C语言中,认为非0即为真. //BOOL 类型规定的存储空间为一个字节. //    BOOL a = YES; //    BOOL b = NO; //    printf("a = %d, b = %d\n", a, b); //    int a = 15, b = 18; //    BOOL c = a > b; //    printf("c = %

C语言零基础项目驱动式学习第三天

一 while循环二do   while循环三 for循环for循环的执行顺序用如下表达式: for(expression1;expression2;expression3)        循环变量初值; 循环条件; 循环变量增量  {                expression4; }       执行的顺序应该是: 1)第一次循环,即初始化循环.      首先执行表达式expression1(一般为初始化语句):再执行expression2(一般为条件判断语句),判断express

C语言零基础项目驱动式学习第一天

引言: 智能手机(Smart Phone)是一种运算能力及功能比传统手机更强的手机.目前的操作系统基本上有以下几种: 1. Symbian Os 众所周知塞班隶属于NOKIA,Symbian开发之初的目标是保证在较低资源的设备上能长时间的运行,这导致了塞班的应用程序开发有着较为陡峭的学习路线,开发成本高,但是程序的运行的效率很高> 2.Android 开源, 联盟,Android凝聚了几乎遍布全球的力量,这是Android形象及声音能够被传到全球移动互联网市场每一个角落的根本原因.不过, 1).