【翻译】知识图谱介绍:事物,而非字符串

翻译辛格尔博士对知识图谱的介绍,原文链接:https://googleblog.blogspot.com/2012/05/introducing-knowledge-graph-things-not.html?hl=zh_CN

搜索,大多与发现——人类基本对学习和拓宽其视野的需求——有关。但对用户而言,进行搜索仍然需要大量困难的工作。因而今天我非常兴奋地推出知识图谱,它将更快、更容易地帮助你发现新信息。

比如搜索【泰姬陵】,在过去四十年里,搜索基本上都是在匹配查询的关键词,对一个搜索引擎而言,【泰姬陵】这个词仅仅是这几个字而已。但是我们都知道【泰姬陵】拥有更加丰富的含义,你可以联想到一个世界上最美丽的遗迹;或者一个获得格莱美奖的音乐家;或者甚至是一个位于新泽西大西洋城的赌场;再或者(你上次去品尝的)最近的印度餐厅。这就是为何我们一直致力于一个智能模型、或者一张图谱的原因:理解真实世界的实体及他们之间的联系——事物、而非字符串。

知识图谱能使你对谷歌知道的事情、人或地点进行搜索——包括地标、名人、城市、球队、建筑、地理特征、电影、天体、艺术作品及更多其他东西,并且能立即获取到与查询相关的信息。这是构建下一代搜索引擎的关键的第一步,它融合网络的集体智慧,使其更像人类一样理解世界。

谷歌知识图谱不仅源于诸如Freebase、维基百科和中情局世界概况这些公共资源,它的规模要大得多——因为我们关注的是全面的深度和广度。它目前包含超过5亿个对象,以及超过35亿个事实和这些不同对象之间的关系。它是基于人们的搜索,以及我们在网络上的发现。

知识图谱主要在3个方面增强了谷歌搜索:

1. 发现正确的事物

语言是模棱两可的——你所说的【泰姬陵】是一个遗迹?还是一个叫【泰姬陵】的音乐家?现在谷歌能理解这个差别,然后能够把搜索结果缩小到一个你期望的意思上——只需点击其中一个链接就可以看到特定的结果:

这是知识图谱使谷歌搜索更智能的一种方法——你搜索的结果更加与你的期望相关,因为我们理解这些实体及他们含义上的细微差别。

2. 得到最好的总结

通过知识图谱,谷歌可以更好地理解你的查询,所以我们可以围绕该主题总结相关的内容,包括你可能需要的特定关键事实。例如,如果你正在寻找玛丽居里,你会看到她出生和去世的时间,但你也会得到她的教育经历和科研发现的细节:

我们是怎么知道每一个条目(指每次用户使用搜索引擎时输入的关键词)最需要哪些事实的呢?为此,我们回归我们的用户,研究汇总他们询问谷歌的每个条目。例如,人们感兴趣的是知道查尔斯·狄更斯写了什么书,而他们对兰克·劳埃德·赖特写的书不感兴趣,更多的是想了解他设计了什么建筑。

知识图谱也帮助我们理解事物之间的关系。玛丽居里是一个在知识图谱中的人,她有两个孩子,其中一人也获得了诺贝尔奖;还有她的丈夫,皮埃尔·居里,获得了这个家庭的第三个诺贝尔奖。所有这些都在我们的图谱中关联起来。它不仅仅是一个对象的目录,它也对所有这些内在联系进行建模。关键在于,这是一种在这些不同的实体间建立联系的智慧。

3. 走的更深、更宽

最后,最有趣的部分——知识图谱可以使你有一些意想不到的发现。你可能会学习到一个全新的事实或与一个事实建立全新的联系。你知道Matt Groening(辛普森——我最喜欢的电视角色——之父)是在哪里获得的Homer、Marge和Lisa名字的灵感吗?有点出人意料:

我们一直认为,完美的搜索引擎应该准确地理解你的意思,反馈给你想要的东西。而现在,我们有时可以在你提出下一个问题之前,就帮你回答它了,因为我们显示的事实是源于别人的类似的搜索。例如,在我们展示的关于汤姆克鲁斯的信息中,也同时展示了百分之三十七的人们通常都会询问的关于他的个下一个问题。事实上,我使用知识图谱的一些最偶然的发现是通过神奇的“别人同时也搜索了...”这一功能。我最喜欢的书之一是“The White Tiger”,阿维德·阿迪加的处女作,他靠这本书赢得了布克奖。而通过知识图谱,我发现了其他三本获得同一奖项的书以及一本获得普利策奖的书。我可以告诉你,这个建议对我来说是有意义的。

我们已经开始逐步向美国的英语用户推出下面这个关于知识图谱的视频,它也将可以在智能手机和平板电脑上观看(查看我们如何为移动设备量身定制)。观看我们的视频以便进一步了解细节和技术。https://youtu.be/mmQl6VGvX-c

我们希望这个附加的功能会给你一个更加完整的你感兴趣的图像、提供更智能的搜索结果、并在新课题上激发你的好奇心。我们为我们的第一个baby阶段的知识图谱感到自豪——这将使我们能够使搜索更加智能,使我们更接近“星际迷航电脑”——我一直梦想的建设。享受你的终身旅程的发现,使谷歌搜索更容易,所以你可以花更少的时间搜索和更多的时间做你喜欢的事情。

时间: 2024-12-09 10:30:49

【翻译】知识图谱介绍:事物,而非字符串的相关文章

开源知识图谱介绍

中文开源知识图谱: (1)中文通用百科知识图谱(CN-DBpedia) 介绍 CN-DBpedia是由复旦大学知识工场实验室研发并维护的大规模通用领域结构化百科,其前身是复旦GDM中文知识图谱. CN-DBpedia主要从中文百科类网站(如百度百科.互动百科.中文维基百科等)的纯文本页面中提取信息,经过滤.融合.推断等操作后,最终形成高质量的结构化数据,供机器和人使用. 下载地址: http://kw.fudan.edu.cn/cndbpedia/download/ (2)思知知识图谱(个人感觉

利用关系抽取构建知识图谱的一次尝试

关系抽取 ??信息抽取(Information Extraction, IE)旨在从大规模非结构或半结构的自然语言文本中抽取结构化信息.关系抽取(Relation Extraction, RE)是其中的重要子任务之一,主要目的是从文本中识别实体并抽取实体之间的语义关系,是自然语言处理(NLP)中的一项基本任务.比如,我们可以从下面的一段话中, 鸿海集团董事长郭台铭25日表示,阿里巴巴集团董事局主席马云提的新零售.新制造中的「新制造」,是他给加上的.网易科技报导,郭台铭在2018深圳IT领袖峰会谈

知识图谱学习与实践(4)——通过例句介绍Sparql的使用

通过例句介绍Sparql的使用 1 简介 SPARQL的定义,是一个递归的定义,为SPARQL Protocal and RDF Query Language,是W3C制定的RDF知识图谱标准查询语言,大部分的图数据库都支持SPARQL查询.SPARQL在语法上借鉴了SQL.SPARQL是针对RDF三元组进行查询,通过图匹配的方式获得需要查找的内容. 下面通过一个例子来说明SPARQL的查询语句的基本结构.这个例子可以在http://dbpedia.org/sparql中运行,获取结果. pre

第二章 知识图谱——机器大脑中的知识库

第二章 知识图谱——机器大脑中的知识库 作者:刘知远(清华大学):整理:林颖(RPI) 版权所有,转载请注明出处 知识就是力量.——[英]弗兰西斯·培根 1 什么是知识图谱 在互联网时代,搜索引擎是人们在线获取信息和知识的重要工具.当用户输入一个查询词,搜索引擎会返回它认为与这个关键词最相关的网页.从诞生之日起,搜索引擎就是这样的模式,直到2012年5月,搜索引擎巨头谷歌在它的搜索页面中首次引入“知识图谱”:用户除了得到搜索网页链接外,还将看到与查询词有关的更加智能化的答案.如下图所示,当用户输

[转载] 知识图谱——机器大脑中的知识库

原文: http://book.thunlp.org/knowledge_graph/ 第二章 知识图谱--机器大脑中的知识库 Published by  liuzy on July 6, 2015 作者:刘知远(清华大学):整理:林颖(RPI) 版权所有,转载请注明出处 知识就是力量.--[英]弗兰西斯·培根 1 什么是知识图谱 在互联网时代,搜索引擎是人们在线获取信息和知识的重要工具.当用户输入一个查询词,搜索引擎会返回它认为与这个关键词最相关的网页.从诞生之日起,搜索引擎就是这样的模式,直

知识图谱文献综述(第一章)

既然决定了以知识图谱作为研究方向,文献综述是必不可少的. 本文主要总结<知识图谱发展报告(2018)-中国中文信息学会> 1. 知识图谱的研究目标与意义 (略) 2. 知识工程的发展历程 3. 知识图谱技术 人们通过概念掌握对客观世界的理解,概念是对客观世界事物的抽象,是将 人们对世界认知联系在一起的纽带.知识图谱以结构化的形式描述客观世界中概 念.实体及其关系.实体是客观世界中的事物,概念是对具有相同属性的事物的 概括和抽象.本体是知识图谱的知识表示基础,可以形式化表示为,O={C,H, P

这是一份通俗易懂的知识图谱技术与应用指南

从一开始的Google搜索,到现在的聊天机器人.大数据风控.证券投资.智能医疗.自适应教育.推荐系统,无一不跟知识图谱相关.它在技术领域的热度也在逐年上升. 本文以通俗易懂的方式来讲解知识图谱相关的知识.尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释. 对于读者,我们不要求有任何AI相关的背景知识. 目录: 概论 什么是知识图谱 知识图谱的表示 知识抽取 知识图谱的存储 金融知识图谱的搭建 定义具体的业务问题 数据收集 & 预处理 知识图谱的设计

[期末复习]《语义网与知识图谱》期末复习(二)

<语义网与知识图谱>期末复习(二) 这次老师发了个最终版的pdf帮助我们复习,那我就重来. 基本 语义web的组成:语义web信息的开放标准.从web描述信息中进一步获取语义的方法. 本体:本体是一种形式化的,对共享概念体系的明确而又详细的说明.提供一种共享词表.核心是分类体系. RDF使用有向图作为数据类型. RDF-Literals 即文本或者说是字符串,在rdf图种用方框表示. RDF表示 一个三元组包含 主语:URIs和空节点 谓语:URIs(通常被成为属性) 宾语:URIs.空节点或

知识图谱研究进展

在原文<知识图谱研究进展>基础上上做了相应的调整和补充 本文首先简要回顾知识图谱的历史,探讨知识图谱研究的意义.其次,介绍知识图谱构建的关键技术,包括实体关系识别技术.知识融合技术.实体链接技术和知识推理技术等.然后,给出现有开放的知识图谱数据集的介绍.最后,给出知识图谱在情报分析中的应用案例. - 漆桂林.高桓.吴天星 东南大学计算机科学与工程学院 本文节选自<情报工程>2017 年第 1 期,知识图谱专题稿件. 1 知识图谱构建技术 ??本节首先给出知识图谱的技术地图,然后介绍