开源知识图谱介绍

中文开源知识图谱:

(1)中文通用百科知识图谱(CN-DBpedia)

介绍

CN-DBpedia是由复旦大学知识工场实验室研发并维护的大规模通用领域结构化百科,其前身是复旦GDM中文知识图谱

CN-DBpedia主要从中文百科类网站(如百度百科、互动百科、中文维基百科等)的纯文本页面中提取信息,经过滤、融合、推断等操作后,最终形成高质量的结构化数据,供机器和人使用。

下载地址:

http://kw.fudan.edu.cn/cndbpedia/download/

(2)思知知识图谱(个人感觉比CN-DBpedia质量更高)

一个名为 OwnThink 的平台在 GitHub 上开源了中文知识图谱项目,这也是目前已开源的最大规模的中文知识图谱,数据是以(实体、属性、值),(实体、关系、实体)混合的形式组织,数据格式采用csv格式,总共有 1.4 亿个三元组。

AI科技大本营(ID:rgznai100)采访了该知识图谱开源项目的算法工程师 Yener,他是开源平台 OwnThink 的作者,主要从事知识图谱、对话机器人、语义理解方面的研究。他表示,知识图谱的开发过程是一个标准的百科知识图谱构建流程,数据抽取来源于结构化数据、半结构化数据、非结构化数据,对各大百科进行抽取后,再对知识进行融合、实时更新等一系列操作。

GitHub 链接:

https://github.com/ownthink/KnowledgeGraphData

百度网盘链接:

https://pan.baidu.com/s/1LZjs9Dsta0yD9NH-1y0sAw 提取码: 3hpp

注:解压密码是 OwnThink 首页地址:https://www.ownthink.com/

(3)OPENKG

OpenKG主要关注知识图谱数据(或者称为结构化数据、语义数据、知识库)的开放,广义上OpenKG属于开放数据的一种。

「知识」包含:

  1. 音乐、电影、书籍等的内容
  2. 科学、历史、地理或其他的数据
  3. 政府或其他行政信息

下载地址:

链接:http://openkg.cn/

英文开源知识图谱:

(1)wikidata

链接:https://www.wikidata.org/wiki/Wikidata:Database_download/zh

说明:包含所有维基数据实体列表

(2)freebase

链接:https://developers.google.com/freebase/

说明:类似维基百科,不同的时freebase是结构化数据

(3)webkb-2

链接:http://www.webkb.org/

说明:允许Web用户在WebKB服务器机器上的一个大的知识库中存储、组织和检索知识

(4)dbpedia

链接:https://wiki.dbpedia.org/

说明:它从维基百科的词条里撷取出结构化的资料,并将其他资料集连结至维基百科。DBpedia 同时也是世界上最大的多领域知识本体之一

(5)wordnet

链接:https://wordnet.princeton.edu/

说明:它是一个覆盖范围宽广的英语词汇语义网

原文地址:https://www.cnblogs.com/jetHu/p/12327629.html

时间: 2024-07-28 19:41:28

开源知识图谱介绍的相关文章

【翻译】知识图谱介绍:事物,而非字符串

翻译辛格尔博士对知识图谱的介绍,原文链接:https://googleblog.blogspot.com/2012/05/introducing-knowledge-graph-things-not.html?hl=zh_CN 搜索,大多与发现--人类基本对学习和拓宽其视野的需求--有关.但对用户而言,进行搜索仍然需要大量困难的工作.因而今天我非常兴奋地推出知识图谱,它将更快.更容易地帮助你发现新信息. 比如搜索[泰姬陵],在过去四十年里,搜索基本上都是在匹配查询的关键词,对一个搜索引擎而言,[

史上规模最大的中文知识图谱以及估值两个亿的 AI 核心代码

—— 大声告诉我,怎样才能可以让你变得更强? —— 充钱 —— ??? —— 都什么玩意?还有啥子咧? —— 充更多钱 执迷不悟,无可救药了. 所以,正确答案应该是什么呢? 答:是知识. 反正,说这些就是为了切入「知识」这个话题. 知识是什么?比如:姚明的身高是 226cm,这就是一个知识. 那么问题来了,世界上错综复杂的事物这么多,我们上哪里去学这么多知识啊?怎么快速把有意义的数据收集下来呢? 爬虫?可以,去爬吧,维基百科,百度百科,爬个全站,然后分析下,是能得到不少知识,可你得花多少钱多少时

知识图谱学习与实践(4)——通过例句介绍Sparql的使用

通过例句介绍Sparql的使用 1 简介 SPARQL的定义,是一个递归的定义,为SPARQL Protocal and RDF Query Language,是W3C制定的RDF知识图谱标准查询语言,大部分的图数据库都支持SPARQL查询.SPARQL在语法上借鉴了SQL.SPARQL是针对RDF三元组进行查询,通过图匹配的方式获得需要查找的内容. 下面通过一个例子来说明SPARQL的查询语句的基本结构.这个例子可以在http://dbpedia.org/sparql中运行,获取结果. pre

一文详解达观数据知识图谱技术与应用——技术直播回顾

讲师 | 桂洪冠来源 | AI科技大本营在线公开课 本文根据达观数据桂洪冠在"达观杯"文本智能处理挑战赛期间的技术直播分享整理而成,内容略有删减. ▌一.知识图谱的概述 我们先直观的来看一下什么是知识图谱,下面有一张图,从这张图里可以看到,这个图里圆圈是节点,节点之间有一些带箭头的边来连成,这个节点实际上相当于知识图谱里的实体或者概念,边连线表示实体之间的关系. 知识图谱本质上是一种大型的语义网络,它旨在描述客观世界的概念实体事件以及及其之间的关系.以实体概念为节点,以关系为边,提供一

ERNIE:知识图谱结合BERT才是「有文化」的语言模型

自然语言表征模型最近受到非常多的关注,很多研究者将其视为 NLP 最重要的研究方向之一.例如在大规模语料库上预训练的 BERT,它可以从纯文本中很好地捕捉丰富的语义模式,经过微调后可以持续改善不同 NLP 任务的性能.因此,我们获取 BERT 隐藏层表征后,可用于提升自己任务的性能. 但是,已有的预训练语言模型很少考虑知识信息,具体而言即知识图谱(knowledge graphs,KG),知识图谱能够提供丰富的结构化知识事实,以便进行更好的知识理解.简而言之,预训练语言模型只知道语言相关的「合理

利用关系抽取构建知识图谱的一次尝试

关系抽取 ??信息抽取(Information Extraction, IE)旨在从大规模非结构或半结构的自然语言文本中抽取结构化信息.关系抽取(Relation Extraction, RE)是其中的重要子任务之一,主要目的是从文本中识别实体并抽取实体之间的语义关系,是自然语言处理(NLP)中的一项基本任务.比如,我们可以从下面的一段话中, 鸿海集团董事长郭台铭25日表示,阿里巴巴集团董事局主席马云提的新零售.新制造中的「新制造」,是他给加上的.网易科技报导,郭台铭在2018深圳IT领袖峰会谈

通用知识图谱VS行业知识图谱

??众所周知,知识图谱是Google于2012年提出,用来优化搜索结果.经过多年的发展,知识图谱在人工智能的许多行业都拥有了成熟落地的应用.按照知识图谱的覆盖面来看,主要分为通用知识图谱与行业知识图谱. This is why a "web" of notes with links between them is far more useful than a fixed hierarchical system-Cicles and arrows leaves one free to d

知识图谱研究进展

在原文<知识图谱研究进展>基础上上做了相应的调整和补充 本文首先简要回顾知识图谱的历史,探讨知识图谱研究的意义.其次,介绍知识图谱构建的关键技术,包括实体关系识别技术.知识融合技术.实体链接技术和知识推理技术等.然后,给出现有开放的知识图谱数据集的介绍.最后,给出知识图谱在情报分析中的应用案例. - 漆桂林.高桓.吴天星 东南大学计算机科学与工程学院 本文节选自<情报工程>2017 年第 1 期,知识图谱专题稿件. 1 知识图谱构建技术 ??本节首先给出知识图谱的技术地图,然后介绍

(转)知识图谱研究综述: 表示学习、知识获取与应用

摘要 人类知识提供了对世界的认知理解.表征实体间结构关系的知识图谱已经成为认知和人类智能研究的一个日益流行的方向.在本次综述论文中,我们对知识图谱进行了全面的综述,涵盖了知识图谱表示学习.知识获取与补全.时序知识图谱.知识感知应用等方面的研究课题,并总结了最近的突破和未来的研究方向.我们提出对这些主题进行全视角分类和新的分类法.知识图谱嵌入从表示空间.得分函数.编码模型和辅助信息四个方面进行组织.对知识获取,特别是知识图谱的补全.嵌入方法.路径推理和逻辑规则推理进行了综述.我们进一步探讨了几个新