BERT+知识图谱: K-BERT Enabling Language Representation with Knowledge Graph 文献理解

参考文献:BERT+知识图谱:北大-腾讯联合推出知识赋能的K-BERT模型

地址:https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/103790278

此前两篇关于知识图谱结合预训练的文章作为了解:

ERNIE: Enhanced Representation through Knowledge Integration(百度)

a.对实体概念知识的学习来学习真实世界的完整概念的语义表示(MASK词和知识图谱中的实体)

b.对训练语料的扩展尤其是论坛对话语料的引入来增强模型的语义表示能力。

ERNIE: Enhanced Language Representation with Informative Entities(清华)

首先识别句子中的实体并与知识图谱中的实体进行匹配。然后使用一个独立的 TransE 算法获得实体向量,然后再将实体向量嵌入到 BERT 中。

当阅读特定领域文本时,普通人只能根据其上下文理解单词,而专家则可以利用相关领域知识进行推断。目前公开的 BERT、GPT、XLNet 等预训练模型均是在开放领域语料预训练得到的,其就像一个普通人,虽然能够读懂通用文本,但是对于专业领域文本时却缺乏一定的背景知识。

解决这一问题的一个方法是使用专业语料预训练模型,但是预训练的过程是十分耗时和耗计算资源的,普通研究者通常难以实现。例如,如果我们希望模型获得“扑热息痛可以治疗感冒”的知识,则在训练语料库中需要大量同时出现“扑热息痛”和“感冒”的句子。不仅如此,通过领域语料预训练的方式引入专家知识,其可解释性和可控性较差。

除了以上策略,我们还能做些什么来使模型成为领域专家?知识图谱(Knowledge Graph,KG)是一个很好的解决方案。

代码地址:https://github.com/autoliuweijie/K-BERT

1.语言模型训练阶段和原google的Bert_base完全相同,知识图谱及K-Bert的使用完全在具体下游任务的finingtuning阶段。模型参数为Bert_base 12层 1.1亿参数。

2.在CN-DBpedia知识库+KBert模型 在 MSRA-NER(微软的中文NER)任务上,进行效果复现,结果符合论文预期,但是去掉知识图谱后效果却没有降低让我有些质疑模型效果。


Dev f值


Test f值


论文效果


0.960


0.956


复现效果


0.965


0.954


去掉图谱(不让取出额外实体)


0.963


0.957


去掉图谱(让加载的知识图谱实体词典为空)


0.963


0.957

3.KBert融合知识图谱算法实现NER任务源代码分析

(1)加载中文知识图谱CN-DBpedia进入内存,构建实体字典lookup_table有两种模式,默认模式不包含关系词:{“中国”:[“国家”,“北京”],“美国”:[“国家”,“华盛顿DC”]};模式2包含关系词:{“中国”:[“属性国家”,“首都北京”],“美国”:[“属性国家”,“首都华盛顿DC”]};第一步的目的在于为后续

(2)读入NER文本数据及标签,为构建可见矩阵Visible_matrix,将文本数据进行中文分词后依次送入lookup_table判断是否存在关联词,若该词存在关联实体则将关联实体取出,并添加绝对位置和相对位置编号soft position。根据绝对位置和相对位置编号构建可见矩阵。

(3)加载Bert预训练模型,构建NER任务,将softposition embeding+token embedding+segment embedding一起进行embeding。编码层加入Visible_matrix,让进行self_attention的时候每个字符只看到自己应该看见的字符。

(4)输出字符序列的logits通过softmax到对应标签的概率,并计算损失

原文地址:https://www.cnblogs.com/jetHu/p/12274225.html

时间: 2024-08-29 23:17:41

BERT+知识图谱: K-BERT Enabling Language Representation with Knowledge Graph 文献理解的相关文章

ERNIE:知识图谱结合BERT才是「有文化」的语言模型

自然语言表征模型最近受到非常多的关注,很多研究者将其视为 NLP 最重要的研究方向之一.例如在大规模语料库上预训练的 BERT,它可以从纯文本中很好地捕捉丰富的语义模式,经过微调后可以持续改善不同 NLP 任务的性能.因此,我们获取 BERT 隐藏层表征后,可用于提升自己任务的性能. 但是,已有的预训练语言模型很少考虑知识信息,具体而言即知识图谱(knowledge graphs,KG),知识图谱能够提供丰富的结构化知识事实,以便进行更好的知识理解.简而言之,预训练语言模型只知道语言相关的「合理

第二章 知识图谱——机器大脑中的知识库

第二章 知识图谱——机器大脑中的知识库 作者:刘知远(清华大学):整理:林颖(RPI) 版权所有,转载请注明出处 知识就是力量.——[英]弗兰西斯·培根 1 什么是知识图谱 在互联网时代,搜索引擎是人们在线获取信息和知识的重要工具.当用户输入一个查询词,搜索引擎会返回它认为与这个关键词最相关的网页.从诞生之日起,搜索引擎就是这样的模式,直到2012年5月,搜索引擎巨头谷歌在它的搜索页面中首次引入“知识图谱”:用户除了得到搜索网页链接外,还将看到与查询词有关的更加智能化的答案.如下图所示,当用户输

[转载] 知识图谱——机器大脑中的知识库

原文: http://book.thunlp.org/knowledge_graph/ 第二章 知识图谱--机器大脑中的知识库 Published by  liuzy on July 6, 2015 作者:刘知远(清华大学):整理:林颖(RPI) 版权所有,转载请注明出处 知识就是力量.--[英]弗兰西斯·培根 1 什么是知识图谱 在互联网时代,搜索引擎是人们在线获取信息和知识的重要工具.当用户输入一个查询词,搜索引擎会返回它认为与这个关键词最相关的网页.从诞生之日起,搜索引擎就是这样的模式,直

知识图谱研究进展

在原文<知识图谱研究进展>基础上上做了相应的调整和补充 本文首先简要回顾知识图谱的历史,探讨知识图谱研究的意义.其次,介绍知识图谱构建的关键技术,包括实体关系识别技术.知识融合技术.实体链接技术和知识推理技术等.然后,给出现有开放的知识图谱数据集的介绍.最后,给出知识图谱在情报分析中的应用案例. - 漆桂林.高桓.吴天星 东南大学计算机科学与工程学院 本文节选自<情报工程>2017 年第 1 期,知识图谱专题稿件. 1 知识图谱构建技术 ??本节首先给出知识图谱的技术地图,然后介绍

(转)知识图谱研究综述: 表示学习、知识获取与应用

摘要 人类知识提供了对世界的认知理解.表征实体间结构关系的知识图谱已经成为认知和人类智能研究的一个日益流行的方向.在本次综述论文中,我们对知识图谱进行了全面的综述,涵盖了知识图谱表示学习.知识获取与补全.时序知识图谱.知识感知应用等方面的研究课题,并总结了最近的突破和未来的研究方向.我们提出对这些主题进行全视角分类和新的分类法.知识图谱嵌入从表示空间.得分函数.编码模型和辅助信息四个方面进行组织.对知识获取,特别是知识图谱的补全.嵌入方法.路径推理和逻辑规则推理进行了综述.我们进一步探讨了几个新

利用关系抽取构建知识图谱的一次尝试

关系抽取 ??信息抽取(Information Extraction, IE)旨在从大规模非结构或半结构的自然语言文本中抽取结构化信息.关系抽取(Relation Extraction, RE)是其中的重要子任务之一,主要目的是从文本中识别实体并抽取实体之间的语义关系,是自然语言处理(NLP)中的一项基本任务.比如,我们可以从下面的一段话中, 鸿海集团董事长郭台铭25日表示,阿里巴巴集团董事局主席马云提的新零售.新制造中的「新制造」,是他给加上的.网易科技报导,郭台铭在2018深圳IT领袖峰会谈

知识图谱相关会议之观后感分享与学习总结

2015年6月27日,清华大学FIT楼多功能报告厅,中国中文信息学会青年工委系列学术活动--知识图谱研究青年学者研讨会. 由于我毕设是与知识图谱.实体消歧.实体对齐.知识集成相关的,所以去听了这个报告:同时报告中采用手写笔记,所以没有相应的PPT和原图(遗憾),很多图是我自己画的找的,可能存在遗漏或表述不清的地方,请海涵~很多算法还在学习研究中,最后希望文章对大家有所帮助吧!感谢那些分享的牛人,知识版权归他们所有. 目录: 一.面向知识图谱的信息抽取技术 二.常识知识在结构化知识库构建中的应用

典型的知识库/链接数据/知识图谱项目

典型的知识库/链接数据/知识图谱项目 2016年12月27日 Huajun 留下评论 从人工智能的概念被提出开始,构建大规模的知识库一直都是人工智能.自然语言理解等领域的核心任务之一.下面首先分别介绍了早期的知识库项目和以互联网为基础构建的新一代知识库项目.并单独介绍了典型的中文知识图谱项目. 1. 早期的知识库项目 Cyc  :  Cyc是持续时间最久,影响范围较广,争议也较多的知识库项目.Cyc是在1984年由Douglas Lenat开始创建.最初的目标是要建立人类最大的常识知识库.典型的

知识图谱学习与实践(4)——通过例句介绍Sparql的使用

通过例句介绍Sparql的使用 1 简介 SPARQL的定义,是一个递归的定义,为SPARQL Protocal and RDF Query Language,是W3C制定的RDF知识图谱标准查询语言,大部分的图数据库都支持SPARQL查询.SPARQL在语法上借鉴了SQL.SPARQL是针对RDF三元组进行查询,通过图匹配的方式获得需要查找的内容. 下面通过一个例子来说明SPARQL的查询语句的基本结构.这个例子可以在http://dbpedia.org/sparql中运行,获取结果. pre