<知识库的构建> 4-2 实例提取 Instance Extraction

引自Fabian Suchanek的讲义。

总结:介绍了isA这种二元关系和它的应用即推理Taxonomy以得到完整的Taxonomy,再就是介绍了set expansion方法,从种子出发,找到文本中两个与种子相同的实例,就把该文本中其他的实例都添加至种子表中来逐渐的提取实例的方法,此方法也可以应用于HTML表格中。

isA(X,Y) : 是一个表示XY之间的二元关系,若成立则X是Y的子集

Hearst Pattern:是一段文本,表示了isA这种二元关系

例如:Homer is a singer => isA(Homer,Singer),such as,including这种表示包含关系的单词,等等

它必须结合NER和消歧来得到entity事实

小练习:对下列句子应用Heast Pattern,找到isA关系

I lived in such countries as Germany, France, and Bavaria.

He wrote about fictional entities such as Homer, Lisa, and Bielefeld.

I love people that are not genies, especially Homer.

isA(Germany, Country); isA(France, Country); isA(Bavaria, Country);

isA(Homer, fictionalentities); isA(Lisa, fictionalentities); isA(Bielefeld, fictionalentities);

isA(Homer, people);

分类推理Taxonomy Induction:建立完整的Taxonomy的过程,从根到叶

算法:

-      提取isA pattern

-      删除isA关系中造成的环

-      根据各种方式分类我们得到的edges,即数数,子字符串推理etc

扩张集合Set Expansion:通过给出的一个class中的一些实例即种子,从语料库中得到更多entity名字的过程

算法:不断重复这个过程

-      从种子开始,此时种子例如:aaa,bbb

-      找到corpus中X,Y and Z格式的pattern

-      若X,Y,Z中有两个是种子中的instance,那么剩余的那个就添加至KB

小练习:根据种子,找出下文中的新的instance

cities = {Springfield, Austin, Seattle}

句子:... Austin, Seattle, and Houston...

所以找到新的instance:Houston,添加至cities

新cities = {Springfield, Austin, Seattle,Houston}

句子:Houston, Chicago, and Springfield..

根据新cities,我们得到:Chicago,并添加至cities

所以我们得到cities = {Springfield, Austin, Seattle,Houston,Chicago}

语义漂移Semantic Drift:即不该分到这个集合中的的instance被分到了这个集合中

表格集合扩张Table Set Expansion:是针对于HTML的表格的set expansion找实例的方法

算法:

-      根据种子开始

-      找到HTML中的一列,若该列中有两个实例存在于种子表中

-      则把该列实体都添加至种子表中

原文地址:https://www.cnblogs.com/mengzizhao/p/8379733.html

时间: 2024-10-08 21:48:12

<知识库的构建> 4-2 实例提取 Instance Extraction的相关文章

实例变量(instance var)与属性(@property)的关系

实例变量(instance var)与属性(@property)的关系 Objective-C 2.0之后,声明一个@property name自动产生一个实例变量,名为_name,因此省去实例变量和属性重复输入的麻烦.而使用@synthesize可以改变_name名称.@property和@synthesize不必成对出现. @property name:指示编译器自动合成setter和getter方法,setter方法名即setName,而getter方法名即name.@property后面

每天一个JavaScript实例-提取所有链接并添加到页面末尾列表

<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>每天一个JavaScript实例-提取所有链接并添加到页面末尾列表</title> <script> window.onload = function(){ var lin

【前端构建】WebPack实例与前端性能优化

计划把微信的文章也搬一份上来. 这篇主要介绍一下我在玩Webpack过程中的心得.通过实例介绍WebPack的安装,插件使用及加载策略.感受构建工具给前端优化工作带来的便利. 壹 | Fisrt 曾几何时,我们是如上图的方式引入JS资源的,相信现在很少遇见了.近年来Web前端开发领域朝着规范开发的方向演进.体现在以下两点: MVC研发构架.多多益处(逻辑清晰,程序注重数据与表现分离,可读性强,利于规避和排查问题...) 构建工具层出不穷.多多益处(提升团队协作,以及工程运维,避免人工处理琐碎而重

Linux/Unix shell 监控Oracle实例(monitor instance)

使用shell脚本实现对Oracle数据库的监控与管理将大大简化DBA的工作负担,如常见的对实例的监控,监听的监控,告警日志的监控,以及数据库的备份,AWR report的自动邮件等.本文给出Linux 下使用 shell 脚本来监控 Oracle 实例. Linux Shell的相关参考:        Linux/Unix shell 脚本中调用SQL,RMAN脚本        Linux/Unix shell sql 之间传递变量        Linux/Unix shell 调用 P

&lt;知识库的构建&gt; 2-2 检测 Evaluation

引自Fabian Suchanek的讲义. 总结:有三个指数可以看出算法是否好,精确度precision,召回率recall和F1指数.所以本章重点为记忆这三种计算方式. 黄金标准Golden Standard:任务执行在语料库后我们所期待的结果 对的:output与golden standard的交集 精确度 Precision:对的/output的长度 召回率 Recall:对的/golden standard的长度 Precision和Recall的关系:二者不可能都高,一定是一高一低.

什么是实例内部类 Instance inner class有什么语法?

1.Instance inner class定义,用途和用法 (视频下载) (全部书籍) 重要语法:马克-to-win:1)实例内部类一定得有个外层类的实例和它绑定在一起,所以可以用This指针.所以必须先实例化外层类之后才能再实例化内部类.(生活中的例子就是子宫和胚胎(不算试管婴儿!))2)语法规定:实例内部类不能有静态的属性或方法,为什么?因为没有外层类的实例就不应该有实例内部类的任何东西存在,包括内部类的静态属性,但静态属性应该在main方法执行时创建,这样就会产生矛盾,所以规定实例内部类

获取当前应用程序实例(instance:HINSTANCE)(转)

if using MFC AfxGetInstanceHandle(). For console programs, call GetConsoleWindow() to get the HWND then GetWindowLong() to get the HINSTANCE. For the Win32 API, you could also use GetModuleHandle(): //get instance of current program (self)HINSTANCE h

&lt;知识库的构建&gt; 3-1 被命名的实体识别分类 NERC

引自Fabian Suchanek的讲义. 总结:主要讲了NERC的四种方式, NERC Feature,NERC rules, NERC ML和statistical NERC.NERC Feature主要讲在一个窗口中,其他token可以根据三种不同的features定下自己是什么分类,从而定义主token是什么分类.NERC rules主要讲述一种建立rules来判断token分类的方法,若某个句子或某个部分中的词满足该rule中的特征,那么就可以知道主token是哪一类,当然在面对非常大

webpack+vue+vueRouter模块化构建小demo实例超详细步骤(附截图、代码、入门篇)

说明:本demo使用yarn代替npm指令来下载一系列依赖,有详细指令说明:使用WebStorm下Terminal来输入指令: >开始(确认已经安装node环境和yarn包管理工具) 1.新建项目文件名为vuedemo 2.yarn add init  初始化项目 >安装项目依赖 3.yarn add vue 安装最新版vue 4.yarn add webpack webpack-dev-server  安装webpack,webpack-dev-server(是一个小型的Node.js Ex