CRF模型

CRF的全称是Conditional Random Fields，由CMU教授John Lafferty 提出，原文标题：Conditional R andom Fields: Probabilistic Models for Segmenting and Labeling Sequence Data。

不过自己在看文献的时候，有很多都看不懂，所以直接上网看别人总结好的资料，并选择其中需要的信息作为自己的笔记。

转自：http://1.guzili.sinaapp.com/?p=133

CRF模型具有以下特点：（1）CRF在给定了观察序列的情况下，对整个的序列的联合概率有一个统一的指数模型，它具备一个比较吸引人的特性就是其损失函数的凸面性；（2）CRF具有很强的推理能力，并且能够使用复杂、有重叠性和非独立的特征进行训练和推理，能够充分地利用上下文信息作为特征，还可以任意地添加其他外部特征，使得模型能够获取的信息非常丰富；（3）CRF解决了MEMM中的标记偏置问题，这也正是CRF与MEMM的本质区别所在—-最大熵模型在每个状态都有一个概率模型，在每个状态转移时都要进行归一化。如果某个状态只有一个后续状态，那么该状态到后续状态的跳转概率即为1。这样，不管输入为任何内容，它都向该后续状态跳转。而CRFs是在所有的状态上建立一个统一的概率模型，这样在进行归一化时，即使某个状态只有一个后续状态，它到该后续状态的跳转概率也不会为1。

时间： 2024-10-11 17:13:09

CRF模型的相关文章

HMM,MEMM,CRF模型

HMM,MEMM,CRF模型之间关系密切,需看: 参考文献: http://www.cnblogs.com/kevinGaoblog/p/3874709.html http://baike.baidu.com/link?url=3BRZ5qo58-3MaGzPqI7zWhcqNY-0xfjUf79AMDLsv1gHK2JXp2lEZ53KuL56kmJVxlT0hTydmGHXnaAnFqoy1q

标注偏置问题(Label Bias Problem)和HMM、MEMM、CRF模型比较<转>

转自http://blog.csdn.net/lskyne/article/details/8669301 路径1-1-1-1的概率:0.4*0.45*0.5=0.09 路径2-2-2-2的概率:0.018 路径1-2-1-2:0.06 路径1-1-2-2:0.066 由此可得最优路径为1-1-1-1 而实际上,在上图中,状态1偏向于转移到状态2,而状态2总倾向于停留在状态2,这就是所谓的标注偏置问题,由于分支数不同,概率的分布不均衡,导致状态的转移存在不公平的情况. PS:标注偏置问题存在于最

NLP —— 图模型（二）条件随机场（Conditional random field，CRF）

本文简单整理了以下内容: (一)马尔可夫随机场(Markov random field,无向图模型)简单回顾 (二)条件随机场(Conditional random field,CRF) 这篇写的非常浅,基于 [1] 和 [5] 梳理.感觉 [1] 的讲解很适合完全不知道什么是CRF的人来入门.如果有需要深入理解CRF的需求的话,还是应该仔细读一下几个英文的tutorial,比如 [4] . (一)马尔可夫随机场简单回顾概率图模型(Probabilistic graphical model,P

NLP之CRF分词训练（六）

分三步1.先分词2.做BEMS标注,同时做词性标注3.训练模型 1.对语料进行分词拿到测试部的语料或者其他渠道的语料,先对语料进行分词,我刚刚开始是用NS分词的,等CRF模型训练好后,可以直接用CRF进行分词,分完词后要人工核对分词结果,将分词分得不正确的地方修改好 2.标注词性,标注BEMS BEMS所说是中科院的提出一种标注,也有说BEIS的,hanlp用的是BEMSB:开始E:结束M/I:中间 S:单独BEMS标注已经写了一个方法generateCRF在SegAndSave.class中

机器学习实战——条件随机场（CRF）

声明:本文是在<最优化方法>课程中阅读的Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data这篇文章后的总结. CRF由来条件随机场(CRF)这种用来解决序列标注问题的机器学习方法是由John Lafferty于2001年发表在国际机器学习大会ICML上的一篇经典文章所引入,对后人的研究起到了非常大的引领作用.特别是标注问题在很多自然科学领域有广泛应用,在自然语言处理

机器学习 —— 条件随机场模型

1.背景有了强大的log-linear模型,连水槽都能拿来做分类特征了,当然要想办法用一下试试了.log-linear模型的输入是一系列几乎接近自然语言的特征方程,这种抽象的东西拿来做语义识别自然是再好不过了.语义识别有一个重要的步骤,叫做 ”给句子贴标签“,简而言之,就是给定一个句子,通过识别其中一些特征:比如存在人名,地名,日期,商品名称,从而判断这个句子的属性(做交易,下任务,更改设置等.) 能够准确的识别句子中的这些 tag 可以有助于理解一个句子.但是要怎样来确定某个单词是不是地名或

HMM模型

通过前几时断续的学习,发现自己对HMM模型的了解还只停留在皮毛,导致在学习CRF模型并将其与最大熵模型.HMM.MEMM做比较时感觉很吃力,所以又花了两天时间使劲看了遍HMM,发现了解得确实深刻了很多,现小结一下,争取把看过的知识变成自己的,特别感谢52nlp网站http://www.52nlp.cn/和崔晓源翻译的HMM相关资料,英文学习网站http://www.comp.leeds.ac.uk/roger/HiddenMarkovModels/html_dev/main.html,中文神马的

CRF++使用小结

1. 简述最近要应用CRF模型,进行序列识别.选用了CRF++工具包,具体来说是在VS2008的C#环境下,使用CRF++的windows版本.本文总结一下了解到的和CRF++工具包相关的信息. 参考资料是CRF++的官方网站:CRF++: Yet Another CRF toolkit,网上的很多关于CRF++的博文就是这篇文章的全部或者部分的翻译,本文也翻译了一些. 2. 工具包下载第一,版本选择,当前最新版本是2010-05-16日更新的CRF++ 0.54版本,不过这个版本以前我用过

CRF条件随机场

CRF的进化 https://flystarhe.github.io/2016/07/13/hmm-memm-crf/参考: http://blog.echen.me/2012/01/03/introduction-to-conditional-random-fields/ 标记偏置问题:MEMM最大熵马尔可夫模型路径1-1-1-1的概率:0.4*0.45*0.5=0.09 路径2-2-2-2的概率:0.2*0.3*0.3=0.018 路径1-2-1-2的概率:0.6*0.2*0.5=0.06

猜你喜欢

数据采集之Web端上传文件到Hadoop HDFS

前言最近在公司接到一个任务,是关于数据采集方面的. 需求主要有3个: 通过web端上传文件到HDFS; 通过日志采集的方式导入到HDFS; 将数据库DB的表数据导入到HDFS. 正好最近都有在这方面 ...

IT痴汉的工作现状25-技术之养成

要想成为技术大牛,除了天赋以外,更与后天的刻苦努力分不开.伟仔我天生愚顿,工作多年后仍与大牛相差甚远,更加认为技术的养成是一个异常困难的过程. 是我不用功吗?我不这样认为.伟仔虽然是个懒人,但对于技术 ...

C++11多线程教学（一）

转载自:http://www.cnblogs.com/lidabo/p/3908705.html 本篇教学代码可在GitHub获得:https://github.com/sol-prog/thread ...

C#, CLR, and .NET Framework versions

C# Version CLR Version Framework versions 1.0 1.0 1.0 1.2 1.1 1.1 2.0 2.0 2.0 ,3.0 3.0 2.0(SP1) 3.5 ...

python做题

Python题目 1.打印一个九九乘法表 #!/usr/bin/env python # -*- coding: utf-8 -*- """ __author__ = ' ...

对团队项目的意见和项目需求的分析

一个软件团队是否能开发出好的软件项目,关键一点就是是否能把握好对项目需求的分析.软件团队如何才能准确而全面的找到这些需求呢?主要有以下几个步骤. 1.获取和引导需求:软件团队需要设身 ...

数据密集型和 cpu密集型 event loop

Node.js在官网上是这样定义的:“一个搭建在Chrome JavaScript运行时上的平台,用于构建高速.可伸缩的网络程序.Node.js采用的事件驱动.非阻塞I/O模型使它既轻量又高效,是构建 ...

建立简单的哈希表

#include<stdio.h> #include <stdlib.h> unsigned int SDBMHash(char *str) { unsigned int ha ...

delphi 18 屏蔽和替换右键菜单

//屏蔽右键菜单procedure TForm1.ApplicationEvents1Message(var Msg: tagMSG; var Handled: Boolean);begin wi ...

说说null和undefined的那些事

网上有很多关于null和undefined的解释,那么今天我们也来简单的聊聊null与undefined的话题,以便解开它们的神秘面纱,当然这这是简单的介绍,在日后会有相应的更新. 为什么用==的时候 ...

PatentTips - Controlling TSC offsets for multiple cores and threads

BACKGROUND Many processors include a time stamp count (TSC) counter which is typically implemented a ...

解决MAC下PHP连接MYSQL错误Warning: mysql_connect(): No such file or directory in conn.php

今天在mac上用php去连接mysql数据库,出现了 mac PHP Warning: mysql_connect(): [2002] No such file... 详细例如以下所看到的: Dir ...

【repost】javascript:;与javascript:void(0)使用介绍

有时候我们在编写js过程中,需要触发事件而不需要返回值,那么就可能需要这样的写法最近看了好几个关于<a>标签和javascript:void(0)的帖子,谨记于此,以资查阅. 注:以下代 ...

常用的十大Python开发工具

据权威机构统计,Python人才需求量每日高达5000+,但目前市场上会 Python 的程序员少之又少, 竞争小,很容易快速高薪就业.可能你并不太了解常用的十大Python开发工具都有哪些,现在告诉 ...

Winform自定义控件：ImageButton（转）

原文地址:https://www.codeproject.com/Articles/29010/WinForm-ImageButton 自定义winfrom图片按钮:支持鼠标正常.悬停.按下更改图片, ...

OSGI实例demo说明（二）

下面我们就来真正的写一个实例demo,结合OSGI的优点来说明一下,该demo设计如下图: 这个demo包含五个Bundles: SayHello Bundle 包含一个接口,只有唯一的方法sayHe ...

在CentOS6.4中安装配置LAMP环境的详细步骤 - Leroy-LIZH

本文详细介绍了CentOS6.4系统中安装LAMP服务并对其进行配置的过程,即安装Apache+PHP+Mysql,参照了网上大神的设置,其他Linux发行系统可以参考~ 在本文中部分命令操作需要ro ...

橇艺闪收苜kn092n7d4v5616

(原标题:国际新闻早报:叙利亚政府与库尔德武装代表会晤)新华社北京4月23日电国际新闻早报: --联合国特使表示将推动叙利亚和谈按计划进行联合国秘书长叙利亚问题特使德米斯图拉22日表示,尽管叙主要反 ...

面面具到!android重力传感器

前两篇都是向大家介绍了很有意思的两种手势操作,嵌入我们游戏中,不得不说让游戏的自由度.可玩性和趣味性都增色不少!那么今天继续给大家介绍一亮点!传感器! 一:什么是传感器: 所谓传感器能够探测如光.热. ...

软件工程第一课，设计简单小学四则运算

题目:设计一个简单的小学四则运算器,要求随机产生30道四则运算题思路:首先想到的是先产生2个随机数,再用for循环进行30次四则运算代码: #include<iostream.h>#i ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.020 s.