7月16日,微软“小冰”项目负责人李笛对外表示:在8月份,“小冰”将带来新的图像识别技术,比如,当“小冰”看到用户给出的一张自己受伤的脚踝照片之后,她会理解该相片图像中的含义,做出回应:“你怎么受伤了”或“怎么这么严重啊?”,也就是说,到了今年8月份,这个小丫头就会说话了。这是在“小冰识狗”之后,微软(中国)又一次重大的技术进步。为什么?
在本文(III)中,我们已经提到支撑“小冰”识狗功能的那十个大机柜。当第一个机柜接受到上述相片之后,机器就开始“卷绕”(Convolurion)动作,在每一次“卷绕”动作之中,系统需要出示一些大数据库中相关的图片信息,训练(或指导)系统在不断地向前“卷绕”中增加对初始相片内容的理解,适当地提出相关信息,直到最后在第十个机柜的输出中,让“小冰”对用户说出上面关心、体贴的话语。
“卷绕”动作的实质是,让系统扫描上一个机柜的信息,以便确定本次训练的内容,正确引导在下一个机柜抽取的图片特征,让机器对图片更加深入的”感知“。可以说,“卷绕”训练的目的就是不断提高系统对输入图片特征的“感知”程度,机柜本身可以认为是图像识别系统的“感知区域”,“感知区域”一个比一个更加清晰地获知输入图片的特征。机柜数量越多,最终输出的识别结果就最佳。
“卷绕”训练为什么能够实现?机柜中的人工神经元为什么愿意接受“训练”?为什么很“听话”?听从系统的指挥?每个人工神经元对应着一个唯一的IP地址,每次“卷绕”动作都要涉及一批IP地址。图像识别系统是典型的并行计算,如同人脑的神经网皮层的活动。
当前,Win10发布在即,“风雨欲来风满楼”,操作系统具有人工智能的消息铺天盖地迎面砸来,让“国产操作系统”鼓吹者无地自容!呜呼!人工神经元到底具有什么特征,且听下回分解。
袁萌 7月19日
版权声明:本文为博主原创文章,未经博主允许不得转载。