知识图谱构建浅析

知识图谱应用如图所示,目前各大互联网公司已落地多个知识图谱产品,或者正在积极构建知识图谱,图谱技术成为“兵家必争”之地。

1. 什么是知识图谱?

知识图谱(Knowledge Graph)的概念由谷 歌 2012 年正式提出,旨在实现更智能的搜索引擎,并且于 2013 年以后开始在学术界和业界普及,并在智能问答、情报分析、反欺诈等应用 中发挥重要作用。

知识图谱以语义网( Semantic Web) 和领域本体( Ontology) 为其关键技术的大规模语义网络知识库。

Knowledge Graph是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系。其基本组成单位是“实体-关系-实体”三元组,以及实体及其相关属性-值对,实体间通过关系相互联结,构成网状的知识结构。Knowledge Graph本质是以语义三元组为基础的结构化的海量知识库。

知识图谱的定义让人不明觉厉,那实际构建的知识图谱是什么样子?

2. 知识图谱的几个关键概念

2.1 本体

领域术语集合。本体最为抽象,简单理解就是一堆概念,这堆概念集合能够描述某个具体的domain里的一切事物的共有特征,然后概念间又有一定的关系,所有构成一个具有层级特征的结构。所以在语义网里ontology和schema基本不分家。

在上面知识图谱的例子中,本体是足球领域schema

2.2 类型 type

具有相同特点或属性的实体集合的抽象,如足球球员、足球联赛、足球教练等。

2.3 实体

实体就是type的实例,如足球球员--梅西,足球联赛--西甲等。

2.4 关系

实体与实体之间通过关系关联起来,如梅西是巴塞罗那的球员。

2.5 属性

实体自带信息是属性,如梅西 出生日期 1987年6月24日, 身高 1.7米等。

2.6 知识图谱

图状具有关联性的知识集合。可以由三元组(实体entity,实体关系relation,实体entity)表示。

这幅图描述了知识图谱中的概念之间的关系。

2.7 知识库

知识库(Knowledge Base),就是一个知识数据库,包含了知识的本体和知识。Freebase是一个知识库(结构化),维基百科也可以看成一个知识库(半结构化),等等。知识图谱可以看成是由图数据库存储的知识库。

3. 工业界如何构建知识图谱?

  • 美图知识图谱技术链:

  • 转转的二手电商知识图谱构建

工业界的特点是它有细分的领域,有良好的业务模型,有大量的数据沉淀。他们一开始先构建Schema,数据有一部分来自于结构化数据,另外需要从半结构化、非结构化数据中获取知识。转转的知识图谱物品词库的构建,大部分数据来自 自有的结构化数据。

知识图谱本身就是图状的知识,关键就是知识获取,获取图中的元素:点、边,即抽取实体、关系。

4. 学术界如如构建知识图谱?

  • 知识图谱构建流程

  • 知识图谱技术

学术界是先抽取实体、关系,然后在这些数据的基础上进行本体抽取,而且难度比较大,涉及大量本体构建的工作。

5. 小结

本体的构建大体有两种方式:自顶向下和自底向上。

  1. 开放域知识图谱的本体构建通常用自底向上的方法,自动地从知识图谱中抽取概念、概念层次和概念之间的关系。这也很好理解,开放的世界太过复杂,用自顶向下的方法无法考虑周全,且随着世界变化,对应的概念还在增长。 其中最典型就是Google的Knowledge Vault。
  2. 领域知识图谱多采用自顶向下的方法来构建本体。一方面,相对于开放域知识图谱,领域知识图谱涉及的概念和范围都是固定或者可控的;另一方面,对于领域知识图谱,我们要求其满足较高的精度。现在大家接触到的一些语音助手背后对接的知识图谱大多都是领域知识图谱,比如音乐知识图谱、体育知识图谱、烹饪知识图谱等等。正因为是这些领域知识图谱来满足用户的大多数需求,更需要保证其精度。自顶向下是先为知识图谱定义好本体与数据模式,再将实体加入到知识库。该构建方式需要利用一些现有的结构化知识库作为其基础知识库,例如Freebase项目就是采用这种方式,它的绝大部分数据是从维基百科中得到的。

学术界的本体构建一般采用自底向下,工业界一般采用自顶向下的方式构建。

知识图谱的很多构建细节,在后续的文章中再详细展示。

参考文献

原文地址:https://www.cnblogs.com/small-k/p/10054479.html

时间: 2024-08-02 17:46:05

知识图谱构建浅析的相关文章

干货好文!自底向上——知识图谱构建技术初探

知识图谱的构建技术主要有自顶向下和自底向上两种.其中自顶向下构建是指借助百科类网站等结构化数据源,从高质量数据中提取本体和模式信息,加入到知识库里.而自底向上构建,则是借助一定的技术手段,从公开采集的数据中提取出资源模式,选择其中置信度较高的信息,加入到知识库中. 在本文中,笔者主要想分享一下自底向上构建知识图谱的全过程,抛砖引玉,欢迎大家交流. “The world is not made of strings , but is made of things.” ——辛格博士,from Goo

合肥工业大学宣城校区大学生创新创业训练项目申报书:“基于Spark平台的人工智能知识的知识图谱构建”

原文地址:https://www.cnblogs.com/25th-engineer/p/10803592.html

知识图谱基础知识之三——知识图谱的构建过程

前两次介绍了知识图谱的基本概念和知识图谱的构建方式,这次介绍一个知识图谱系统的构建过程. 1 知识图谱的总体构建思路 如图所示,从原始的数据到形成知识图谱,经历了知识抽取.知识融合(实体对齐).数据模型构建.质量评估等步骤. 原始的数据,按照数据的结构化程度来分,可以分为结构化数据.半结构化数据和非结构化数据,根据数据的不同的结构化形式,采用不同的方法,将数据转换为三元组的形式,然后对三元组的数据进行知识融合,主要是实体对齐,以及和数据模型进行结合,经过融合之后,会形成标准的数据表示,为了发现新

大规模、高质量的金融知识图谱,如何自动化构建?

知识图谱(Knowledge Graph, KG)本质上是一种大规模语义网络,包含实体.概念及其之间的各类语义关系,目前已经成为认知智能的基石,是发展人工智能的核心技术,它让机器语言认知.可解释人工智能成为可能,能够显著增强机器学习的能力,将成为与数据驱动相并列的一种非常重要的解决问题的方式. 最近几年,以知识图谱为代表的智能化技术正在触及越来越多领域,许多企业都已将人工智能升格为企业的核心战略.目前在金融领域,知识图谱等人工智能技术也正在赋能越来越多的业务,推动金融更加智能化. 金融KG的挑战

NLPIR系统构建知识图谱助力智能客服服务

目前,市场上的智能客服机器人已经是一款成熟的SASS产品,90%以上的企业都可以直接接入,数据保存在云端或者机器人公司的数据库,部署非常方便.同时,对于一些大型集团公司或者金融类企业,对数据保密性要求比较高的,也可以实施落地化部署,所有数据均存放在企业本地服务器上. 智能客服机器人的应用场景有哪些寒暄闲聊,有趣互动丰富的寒暄语库,贴合业务场景,模拟真人对话亲切自然. 意向初筛,精准分流机器人通过消息过滤实现客户意向捕捉,精准分流并触发人工服务,通过高效率的问答处理,过滤出更有价值的高净值用户.

自下而上构建知识图谱全过程

导读:关于知识图谱构建的过程,<详解自下而上构建知识图谱全过程>基本都覆盖到了,安利一下,作为入门读物是极好的,本篇并非原创,内容基本来自于此(原作者如果疑问,请联系删除).当然知识图谱的概念定义,现在个人感觉并没有完全统一的标准,文中有些分类和观点我也不是完全认同,后续会有博客系统阐述我对于知识图谱相关概念理解和定义 "The world is not made of strings , but is made of things."--辛格博士,from Google.

十四,教育知识图谱的概念模型与构建方法研究

论文名称:教育知识图谱的概念模型与构建方法研究 李振,周东岱. 研究对象以知识图谱为基础,构建教育知识图谱概念模型,对其智能化构建方法进一步研究. 研究动机 知识图谱相比其他知识建模方法,能够表达更广泛的知识内容及语义关联关系,构建自动化程度高. 在知识粒度,领域适应性,构建方法方面均可深入研究. 文献综述 主要知识图谱模型理解,对构建方法深入学习研究. 对模型结构,构成要素,及要素阐述内容进行记录理解. 学习本知识图谱构建方法,及各步骤采取模型方法(条件随机场模型来完成知识元抽取,Aprior

第二章 知识图谱——机器大脑中的知识库

第二章 知识图谱——机器大脑中的知识库 作者:刘知远(清华大学):整理:林颖(RPI) 版权所有,转载请注明出处 知识就是力量.——[英]弗兰西斯·培根 1 什么是知识图谱 在互联网时代,搜索引擎是人们在线获取信息和知识的重要工具.当用户输入一个查询词,搜索引擎会返回它认为与这个关键词最相关的网页.从诞生之日起,搜索引擎就是这样的模式,直到2012年5月,搜索引擎巨头谷歌在它的搜索页面中首次引入“知识图谱”:用户除了得到搜索网页链接外,还将看到与查询词有关的更加智能化的答案.如下图所示,当用户输

[转载] 知识图谱——机器大脑中的知识库

原文: http://book.thunlp.org/knowledge_graph/ 第二章 知识图谱--机器大脑中的知识库 Published by  liuzy on July 6, 2015 作者:刘知远(清华大学):整理:林颖(RPI) 版权所有,转载请注明出处 知识就是力量.--[英]弗兰西斯·培根 1 什么是知识图谱 在互联网时代,搜索引擎是人们在线获取信息和知识的重要工具.当用户输入一个查询词,搜索引擎会返回它认为与这个关键词最相关的网页.从诞生之日起,搜索引擎就是这样的模式,直