cs224n第六讲依存分析

1、句法结构:成分结构和依存结构

两种角度的语言结构:

句子成分语法=短语结构语法=上下文无关语法

Constituency = phrase structure grammar = context-free grammars(CFGs)

依存句法结构(找到词之间的依赖关系,或者说是修饰关系,一般用箭头来表示)

Dependency structure

依存句法的难点:依附的语义模糊性

标注型数据的发展:通用依存树库的建立,给自然语言处理的工作带来很多方便

2、依存句法结构

依存语法和依存结构

依存语法组成:

  • 头部
  • 独立的依赖项
  • 箭头(依赖关系)
  • 无环

依存分析的参考根据:

  • 双关语(discussion of issues)
  • 依赖距离,大多数是相邻近的单词
  • 介入信息(标点符号一些介入)
  • 头部的分析(比如哪侧有多少依赖项是正常的)

做依存分析的方法:动态编程法;基于图的算法(如最小生成树);约束补偿方法;基于转换的依存解析方法,也叫确定性依存句法分析。

3、基于转换的依存分析方法

Greedy transition-based dependency parsing(Nivre 2003)

基于基本转换的依存分析器的组成:

基于弧标准转换的依存分析:

  • Shift:从右边的buffer取顶部元素放到左边stack的顶部(stack的顶部在最右,buffer的顶部在最左)
  • Left-Arc:从stack中取栈顶第二个元素出去
  • Right-Arc:从stack中取栈顶元素出去

如何找到下一个要操作的动作:

MaltParser [Nivre and Hall 2005]

4、神经依存分析

为什么要训练一个神经依存分析器?指示特征的重新访问

问题:稀疏性;不完整;计算耗费大

A neural dependency parser [Chen and Manning 2014]

模型框架:

原文地址:https://www.cnblogs.com/py-fwg/p/10032716.html

时间: 2024-08-30 06:26:01

cs224n第六讲依存分析的相关文章

16位汇编第六讲汇编指令详解第二讲

16位汇编第六讲汇编指令详解第二讲 1.比较指令 CMP指令 1.CMP指令是将目的操作数减去源操作数,按照定义相应的设置状态标志 2.CMP指令执行的功能与SUB指令(相减指令)一样,但是不同的是CMP指令之根据结果设置标志位 而不修改值 可以操作的指令格式 CMP reg,imm/reg/mem CMP mem,imm/reg 上面是CMP指令的语法,具体的也可以查询帮助文档,inter手册 inter手册查的办法 第一个框代表了CMP指令的所有语法 比如 reg,reg 表示可以比较寄存器

UI第六讲.UISegmentControl的使用,UISliser的使用,UIImageView的使用,UIControl的作用

一.UISegmentedControl的使用(分段控件) UISegmentedControl是iOS中的分段控件. 每个segment都能被点击,相当于集成了若干个button.通常我们会点击不同的segment来切换不同的view. 示例图: 常用方法: 示例代码: 基本的UISegmentControl的用法,同时通过其addtarget/action方法实点击切换view背景色的效果 效果图:点击UISegmentControl的item,切换背景色 二.UISlider的使用(滑块控

第六讲 map

2.  map简介 map是一类关联式容器.它的特点是增加和删除节点对迭代器的影响很小,除了那个操作节点,对其他的节点都没有什么影响.对于迭代器来说,可以修改实值,而不能修改key. 3.  map的功能 自动建立Key - value的对应.key 和 value可以是任意你需要的类型. 根据key值快速查找记录,查找的复杂度基本是Log(N),如果有1000个记录,最多查找10次,1,000,000个记录,最多查找20次. 快速插入Key - Value 记录. 快速删除记录 根据Key 修

(笔记)斯坦福机器学习第六讲--朴素贝叶斯

本讲内容 1. Naive Bayes(朴素贝叶斯) 2.Event models(朴素贝叶斯的事件模型) 3.Neural network (神经网络) 4.Support vector machines(支持向量机) 1.朴素贝叶斯 上讲中的垃圾邮件问题有几个需要注意的地方: (1)  一个单词只有出现和不出现两种可能,因此每个特征x只有两个取值 (2) 特征向量x的个数应该等于词典的长度,比如  将该算法一般化: (1) 让 可以取更多的值 此时  服从多项式分布,而不再是伯努利分布.一种

Stanford机器学习---第六讲. 怎样选择机器学习方法、系统

原文见http://blog.csdn.net/abcjennifer/article/details/7797502  添加了一些自己的注释和笔记 本栏目(Machine learning)包括单参数的线性回归.多参数的线性回归.Octave Tutorial.Logistic Regression.Regularization.神经网络.机器学习系统设计.SVM(Support Vector Machines 支持向量机).聚类.降维.异常检测.大规模机器学习等章节.所有内容均来自Stand

机器学习基石第六讲:theory of generalization

博客已经迁移至Marcovaldo's blog (http://marcovaldong.github.io/) 机器学习基石第六讲继续讨论"学习是否可行的问题". Restriction of Break Point 继续前面的讨论,我们看mH(N)是否会有一个很小的增长速度.回顾前面的四种成长函数及其break point.我们知道k是一个成长函数的break point,那比k大的值全是break point. mH(N)是一个hypothesis在N个数据点上可以产生的dic

通达OA 培训课程第六讲课件 实际开发案例讲解(图文)

第六讲主要结合过去开发的一些实际典型应用案例来给大家进行一下通达的开发过程及开发成果,通过本课程的学习使学员能够更好的将前面学习的内容进行贯穿整合,从而真正掌握开发技能.

《上古天真论》第六讲文字版

上古天真论篇第六讲 主讲:徐文兵  主持:梁  冬 播出时间:2009-01-10  23:00—24:00 经文:帝曰:人年老而无子者,材力尽邪?将天数然也? 岐伯曰:女子七岁,肾气盛,齿更发长.二七而天癸至,任脉通,太冲脉盛,月事以时下,故有子.三七,肾气平均,故真牙生而长极. 梁冬:大家好,欢迎收听今天的国学堂之发现中医太美之<黄帝内经>之<上古天真论>.在过去的一段时间里呢,我们得以有幸啊,和厚朴中医学堂的徐文兵老师一起来逐字逐字地体会了<黄帝内经>的精妙,我都

蓝鸥零基础学习HTML5第六讲 CSS的常见样式

蓝鸥零基础学习HTML5第六讲 CSS的常见样式 CSS的常见样式 1.css文本样式的设置 <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>Document</title> <style> div { font-size:160px; font-family: "sans-Seri