浅谈深度学习和本体间的关系

在一次会议上得到了这样一个观点说深度学习和本体是同一个方向的两条不同的路径。但是觉得这个两个东西是完全不相关的东东么怎么能扯到一起去呢?后来读了一些语义角色标注的文章发现这种观点确实有些意思。本文结合自己一些对深度学习极为浅显的了解和对本体、机器学习的粗浅理解浅谈一下深度学习和本体的关系。

在这里先要谈一下分类问题如羊是属于动物的,小明是属于人的等等。分类问题在人工智能领域一直占有极重要的地位。那么从统计角度的机器学习是怎么分类呢?大部分的分类器过程都是先找到这个实例的特征,如我对一句话:我爱北京天安门。来进行语义角色标注。其中我被标注为动词主语,名词天安门被标注为动词的宾语。语义角色标注完成后,原来的句子则变成如下的形式:我[arg0] 爱[vb] 天安门[arg1]。从人的角度来看这样的标注非常简单,但是从机器的角度来看就十分困难了,所以我们需要使用一些已知的数据和这些数据的特征对这个分类问题进行训练。最简单的方法就是训练数据里面如果有:我[arg0] 爱[vb] 天安门[arg1] 这样一个训练数据,这时候当有相同的测试数据来的时候那么自然就会将测试数据分成跟训练数据一样的语义角色。但是这样细粒度的特征会造成极大的稀疏性也就是说大量的测试数据是无法在训练数据中找到相同的样例的,这样分类的效果就不会太好。为了解决这个问题人们就会进一步考虑更粗粒度的特征如:我爱北京天安门 根据词性可以变成NP VB NP(名词 动词 名词)这样符合这个更粗粒度模板的句子就可以得到跟 我[arg0] 爱[vb] 天安门[arg1] 相同的语义角色标注。因此我们为了提高分类的效果会尽可能用多个维度,多个不同粒度的特征来归纳总结事物属于某个类别。

而深度学习的思路则是一个更细的分类过程,在传统的机器学习过程中如果训练数据已知NP VB NP中第一个NP是arg0(既主语)第二个NP是arg1(既宾语)那么当来一个句子我爱北京天安门 这样一个具有相同模式的句子时我们会自动将我标注为arg0,天安门标注为arg1。而深度学习则更像一个更细化的机器学习(这里理解比较肤浅)既我第一步先分类判断“我 ”是一个词语w,第二步判断w是一个名词NP,第三步,判断NP后面有一个动词vb,第四步得到NP是arg0。它的区别就是不像传统的机器学习一步得到分类结果而是通过每一步得到一个最小粒度的分类然后这个分类作为下一层分类的特征进而得到更粗粒度的特征。从另一个角度看他把特征从一个词”我“转换到”NP“的过程自动化了。

而本体天然就是一个描述类别层级和类别见关系的逻辑描述。如小孩是人的一个子类,通过规则我们可以知道小孩是一个人。从本质上看他与深度学习的分类方法类似,深度学习的方法是自动的通过统计的而本体的分类规则则是手工的,而深度学习每一层的分类特征是隐含的本体则是有明确的语义关系。单纯从分类的角度来看这两个学派的关系更像以前Yahoo和Google对网页分类的看法。

时间: 2024-09-29 16:23:43

浅谈深度学习和本体间的关系的相关文章

浅谈深度学习中潜藏的稀疏表达

浅谈深度学习中潜藏的稀疏表达 “王杨卢骆当时体,轻薄为文哂未休. 尔曹身与名俱灭,不废江河万古流.” — 唐 杜甫<戏为六绝句>(其二) [不要为我为啥放这首在开头,千人千面千理解吧] 深度学习:概述和一孔之见 深度学习(DL),或说深度神经网络(DNN), 作为传统机器学习中神经网络(NN).感知机(perceptron)模型的扩展延伸,正掀起铺天盖地的热潮.DNN火箭般的研究速度,在短短数年内带来了能“读懂”照片内容的图像识别系统,能和人对话到毫无PS痕迹的语音助手,能击败围棋世界冠军.引

【转载】浅谈深度学习(Deep Learning)的基本思想和方法

浅谈深度学习(Deep Learning)的基本思想和方法 分类: 机器学习 信息抽取 Deep Learning2013-01-07 22:18 25010人阅读 评论(11) 收藏 举报 深度学习(Deep Learning),又叫Unsupervised Feature Learning或者Feature Learning,是目前非常热的一个研究主题. 本文将主要介绍Deep Learning的基本思想和常用的方法. 一. 什么是Deep Learning? 实际生活中,人们为了解决一个问

浅谈流形学习

转载自:http://blog.pluskid.org/?p=533 总觉得即使是“浅谈”两个字,还是让这个标题有些过大了,更何况我自己也才刚刚接触这么一个领域.不过懒得想其他标题了,想起来要扯一下这个话题,也是因为和朋友聊起我自己最近在做的方向.Manifold Learning 或者仅仅 Manifold 本身通常就听起来颇有些深奥的感觉,不过如果并不是想要进行严格的理论推导的话,也可以从许多直观的例子得到一些感性的认识,正好我也就借这个机会来简单地谈一下这个话题吧,或者说至少是我到目前为止

浅谈流形学习(转)

http://blog.pluskid.org/?p=533 总觉得即使是“浅谈”两个字,还是让这个标题有些过大了,更何况我自己也才刚刚接触这么一个领域.不过懒得想其他标题了,想起来要扯一下这个话题,也是因为和朋友聊起我自己最近在做的方向.Manifold Learning 或者仅仅 Manifold 本身通常就听起来颇有些深奥的感觉,不过如果并不是想要进行严格的理论推导的话,也可以从许多直观的例子得到一些感性的认识,正好我也就借这个机会来简单地谈一下这个话题吧,或者说至少是我到目前为止对这它的

浅谈强化学习的方法及学习路线

介绍 目前,对于全球科学家而言,“如何去学习一种新技能”成为了一个最基本的研究问题.为什么要解决这个问题的初衷是显而易见的,如果我们理解了这个问题,那么我们可以使人类做一些我们以前可能没有想到的事.或者,我们可以训练去做更多的“人类”工作,常遭一个真正的人工智能时代. 虽然,对于上述问题,我们目前还没有一个完整的答案去解释,但是有一些事情是可以理解的.先不考虑技能的学习,我们首先需要与环境进行交互.无论我们是学习驾驶汽车还是婴儿学习走路,学习都是基于和环境的相互交互.从互动中学习是所有智力发展和

当我们谈深度学习时,我们用它落地了什么?

摘要: 近日,阿里云在深度学习方面动作频频,先后发布了OCR证件识别,声纹检测,人脸搜索,视频鉴黄服务以及相似图片搜索功能,下面小编就一一为大家介绍五大功能应用. 现今伴随人工智能在技术上的不断突破,一些领域如计算机视觉,已开始与各个行业进行了深度融合.例如保险行业已通过人脸识别这种新时代的认证方式,来对用户身份信息进行识别与审核.深度学习对人工智能的发展起着至关重要的影响. 近日,阿里云在深度学习方面动作频频,先后发布了OCR证件识别,声纹检测,人脸搜索,视频鉴黄服务以及相似图片搜索功能,下面

以CapsNet为例谈深度学习源码阅读

本文的参考的github工程链接:https://github.com/laubonghaudoi/CapsNet_guide_PyTorch 之前是看过一些深度学习的代码,但是没有养成良好的阅读规范,由于最近在学习CapsNet的原理,在Github找到了一个很好的示例教程,作者甚至给出了比较好的代码阅读顺序,私以为该顺序具有较强的代码阅读迁移性,遂以此工程为例将该代码分析过程记录于此: 1.代码先看main(),main()为工程中最为顶层的设计,能够给人对于整个流程的把控.而对于深度学习而

浅谈java学习

本科上学的时候就学过两个学期的java,那时候学到的都谈不上基础,只是模糊知道一些语法和编程规则,第一个学期学习java,因为有之前c语言60%挂科率的心理阴影,对学习计算机编程语言在心理上是抗拒的,所以导致了当时老师念课本我听课本的僵局:第二个学期学习java,老师为了提高我们的编程能力,直接机房上课,一个学期跟着老师一行一行的敲代码,写了一个推箱子的游戏,说成复制更合适,因为完全没有自己的思想,就想机械工人一样只是照搬照抄,但好处还是有的,最起码知道该怎么操作eclipse.进入研究生学习阶

浅谈流形学习(Manifold Learning)

Machine Learning 虽然名字里带了 Learning 一个词,让人乍一看觉得和 Intelligence 相比不过是换了个说法而已,然而事实上这里的 Learning 的意义要朴素得多.我们来看一看 Machine Learning 的典型的流程就知道了,其实有时候觉得和应用数学或者更通俗的数学建模有些类似,通常我们会有需要分析或者处理的数据,根据一些经验和一些假设,我们可以构建一个模型,这个模型会有一些参数(即使是非参数化方法,也是可以类似地看待的),根据数据来求解模型参数的过程