<知识库的构建> 2-2 检测 Evaluation

引自Fabian Suchanek的讲义。

总结：有三个指数可以看出算法是否好，精确度precision，召回率recall和F1指数。所以本章重点为记忆这三种计算方式。

黄金标准Golden Standard：任务执行在语料库后我们所期待的结果

对的：output与golden standard的交集

精确度 Precision：对的/output的长度

召回率 Recall：对的/golden standard的长度

Precision和Recall的关系：二者不可能都高，一定是一高一低。

- 若Precision高：说明结果很好，但是有很多instance没有被检测

- 若Recall高：得到的结果中有很多是错的，但泛化能力强

- 若黄金标准和output长度一样(一个实例一个结果时)：precision=recall

F1指数F1 Mesure：表示precision和recall的均值

2 * (Precision * Recall) / (Precision + Recall)

原文地址：https://www.cnblogs.com/mengzizhao/p/8378711.html

时间： 2024-11-05 17:32:10

<知识库的构建> 2-2 检测 Evaluation的相关文章

开源系统中构建纵深入侵检测及防御体系技术剖析

https://www.ibm.com/developerworks/cn/linux/l-cn-ids/

<知识库的构建> 2-1 有名字的实体的识别 Named Entity Recognition

引自Fabian Suchanek的讲义. 总结:NER是为了从语料库中找到实体的名字,即要识别语料库中哪写单词使我们想读出来的.NER的实现主要有两种方法,一种是字典法,另一种是正则表达式法.传统字典法就是把entity放入字典中去找是否有对应的名字,很慢,所以后期有了新字典法,即Trie.正则部分强调了如何根据language的形态写出对应的正则.所以重点是要知道实现NER的两种方法及其优缺点及如何用正则描述language. 被命名的实体Named entity:带名字的entity 被命

<知识库的构建> 3-1 被命名的实体识别分类 NERC

引自Fabian Suchanek的讲义. 总结:主要讲了NERC的四种方式, NERC Feature,NERC rules, NERC ML和statistical NERC.NERC Feature主要讲在一个窗口中,其他token可以根据三种不同的features定下自己是什么分类,从而定义主token是什么分类.NERC rules主要讲述一种建立rules来判断token分类的方法,若某个句子或某个部分中的词满足该rule中的特征,那么就可以知道主token是哪一类,当然在面对非常大

<知识库的构建> 3-2 条件随机场Condition Random Field

@font-face { font-family: "Cambria Math"; }@font-face { font-family: "DengXian"; }@font-face { font-family: "@DengXian"; }p.MsoNormal, li.MsoNormal, div.MsoNormal { margin: 0cm 0cm 0.0001pt; font-size: 12pt; font-family: &quo

<知识库的构建> 4-2 实例提取 Instance Extraction

引自Fabian Suchanek的讲义. 总结:介绍了isA这种二元关系和它的应用即推理Taxonomy以得到完整的Taxonomy,再就是介绍了set expansion方法,从种子出发,找到文本中两个与种子相同的实例,就把该文本中其他的实例都添加至种子表中来逐渐的提取实例的方法,此方法也可以应用于HTML表格中. isA(X,Y) : 是一个表示XY之间的二元关系,若成立则X是Y的子集 Hearst Pattern:是一段文本,表示了isA这种二元关系例如:Homer is a sing

<知识库的构建> 6-2 决定性 Decidability

总结:这个章节随他而去吧可决定问题:可以回答yes或no的问题不可决定问题:不能回答yes或no的问题例如:这个程序是否能停止 Entscheidungs problem:半决定问题 FOL是不可决定问题原文地址:https://www.cnblogs.com/mengzizhao/p/8383401.html

<知识库的构建> 5-3 马尔科夫逻辑 Markov logic

引自Fabian Suchanek的讲义. 总结:马尔科夫你需要知道这么几个点: 第一个是要知道如何形成马尔科夫随机场的条件,就是当有多个随机变量满足:Xi只由他的邻居决定,至于邻居是可以形成无向图,邻居是点,邻居和邻居的连线是边. 第二个要清楚的是Hammersley-Clifford-Theorem形成的条件,很容易,是说马尔科夫随机场里面的P都大于0的时候,这个也叫作矢量化,在CRF里面有提到,也就是当P大于0的时候,x也就是一条一条的rules,当他们成立的时候的概率等于势函数的乘积.

vc++视频教程软件工程师培训课程 VC知识库大讲堂

下载地址: http://www.enginedx.com/78/m299/ <C/C++软件工程师实战能力集训大纲>的现实意义在哪里?] 1.作为一个C/C++软件工程师,需要掌握的东西真是挺多的: 2.纵观目前中国的C/C++ 人才队伍,能满足以上能力要求的,只在少数.很多用人企业感叹,社招的人员能力参差不齐.普遍现象是他们只对其中的某一小部分内容有一个熟练的掌握,而对大部分的内容一知半解,甚至一无所知.这也是直接导致国内软件业开发实力普遍不强的最重要的原因.

使用xmake检测编译器特性支持

如果我们要写跨平台的c/c++代码,很多时候需要处理由于不同编译器对c/c++各个标准支持力度不同导致的兼容性问题,一般通常的解决办法是:自己在代码中通过宏去判断各个编译器的版本.内置宏.标准库宏.__has_feature等来检测处理. 自己如果在代码中按上述的方式检测,会很繁琐,尤其是像c++这种存在大量语法特性,如果一一检测过来,工作量是非常大的. 通过构建工具预先检测编译特性另外比较省事的方式,就是依赖构建工具提前做好检测,然后把检测结果作为宏添加到编译中去,这样代码只需要判断对应的特