中文依存句法分析概述及应用

  句法分析是自然语言处理领域的一个关键问题,如能将其有效解决,一方面,可对相应树库构建体系的正确性和完善性进行验证;另一方面,也可直接服务于各种上层应用,比如搜索引擎用户日志分析和关键词识别,比如信息抽取、自动问答、机器翻译等其他自然语言处理相关的任务。

  短语结构和依存结构是目前句法分析中研究最广泛的两类文法体系。这里先大概介绍下依存结构。

  依存文法最早由法国语言学家L.Tesniere在其著作《结构句法基础》(1959年)中提出,对语言学的发展产生了深远的影响,特别是在计算语言学界备受推崇。

  依存语法通过分析语言单位内成分之间的依存关系揭示其句法结构,主张句子中核心动词是支配其它成分的中心成分,而它本身却不受其它任何成分的支配,所有受支配成分都以某种依存关系从属于支配者。

  在20世纪70年代,Robinson提出依存语法中关于依存关系的四条公理,在处理中文信息的研究中,中国学者提出了依存关系的第五条公理,如下:

1、一个句子中只有一个成分是独立的;
2、其它成分直接依存于某一成分;
3、任何一个成分都不能依存与两个或两个以上的成分;
4、如果A成分直接依存于B成分,而C成分在句中位于A和B之间,那么C或者直接依存于B,或者直接依存于A和B之间的某一成分;
5、中心成分左右两面的其它成分相互不发生关系。

  句子成分间相互支配与被支配、依存与被依存的现象普遍存在于汉语的词汇(合成语)、短语、单句、复合直到句群的各级能够独立运用的语言单位之中,这一特点为 依存关系的普遍性,依存句法分析可以反映出句子各成分之间的语义修饰关系,它可以获得长距离的搭配信息,并与句子成分的物理位置无关。

附:LTP依存分析模块所使用的依存关系标记含义 (http://www.ltp-cloud.com/demo/)

现在的依存句法分析标注关系 (共14种) 及含义如下:

关系类型 Tag Description Example

主谓关系


SBV


subject-verb


我送她一束花 (我 <-- 送)


动宾关系


VOB


直接宾语,verb-object


我送她一束花 (送 --> 花)


间宾关系


IOB


间接宾语,indirect-object


我送她一束花 (送 --> 她)


前置宾语


FOB


前置宾语,fronting-object


他什么书都读 (书 <-- 读)


兼语


DBL


double


他请我吃饭 (请 --> 我)


定中关系


ATT


attribute


红苹果 (红 <-- 苹果)


状中结构


ADV


adverbial


非常美丽 (非常 <-- 美丽)


动补结构


CMP


complement


做完了作业 (做 --> 完)


并列关系


COO


coordinate


大山和大海 (大山 --> 大海)


介宾关系


POB


preposition-object


在贸易区内 (在 --> 内)


左附加关系


LAD


left adjunct


大山和大海 (和 <-- 大海)


右附加关系


RAD


right adjunct


孩子们 (孩子 --> 们)


独立结构


IS


independent structure


两个单句在结构上彼此独立


核心关系


HED


head


指整个句子的核心

以前比较复杂的依存关系标记含义版本:

依存关系标记(共24个)
定中关系ATT(attribute)
数量关系QUN(quantity)
并列关系COO(coordinate)
同位关系APP(appositive)
前附加关系LAD(left adjunct)
后附加关系RAD(right adjunct)
动宾关系VOB(verb-object)
介宾关系POB(preposition-object)
主谓关系SBV(subject-verb)
比拟关系SIM(similarity)
核心HED(head)
连动结构VV(verb-verb)
关联结构CNJ(conjunctive)
语态结构MT(mood-tense)
独立结构IS(independent structure)
状中结构ADV(adverbial)
动补结构CMP(complement)
“的”字结构DE
“地”字结构DI
“得”字结构DEI
“把”字结构BA
“被”字结构BEI
独立分句IC(independent clause)
依存分句DC(dependent clause)

参考链接

时间: 2024-08-30 01:47:05

中文依存句法分析概述及应用的相关文章

使用FudanNLP实现依存句法分析

依存句法分析在自然语言处理NLP中是比较重要的一项技术,FudanNLP工具箱中提供了一种依存句法分析的实现.这篇文章我们来试着使用FudanNLP实现依存句法分析,并看看分析的效果是什么样的形式,以及效果如何. 首先,我们下载了FudanNLP的工具箱源码(开源),依存句法分析的主代码就在example文件夹中的DepParse.java中. 这个程序中支持的依存关系类型集合包括: [关联, 主语, 标点, 疑问连动, 补语, 语态, 的字结构, 介宾, 数量, 宾语, 地字结构, 感叹, 时

Android中文翻译 - AccountManager概述

为了理解,我翻译了AccountManager类的概述部分.转载请注明出处:http://www.cnblogs.com/vir56k/p/4025722.html AccountManager概述 这个类提供了访问到 用户在线账户的集中式注册中心 的能力.用户为每账户输入一次 认证信息(credentials,包含用户名和密码),过过 点击一次(one-click)完成认证的方式,授权应用程序(app)访问 在线的资源.不同的服务具有不同的处理账户的认证的方式,而 Account Manage

Android中文翻译 - AbstractAccountAuthenticator概述

我顺带把AbstractAccountAuthenticator  也翻译了,感觉直接看SampleSyncAdapter例子很难快速明白整体的意图,配合api是个好的方式,感叹android的api这是太详细了. AbstractAccountAuthenticator 概述 AbstractAccountAuthenticator 概述 这是一个抽象的基类,用于创建账户管理器(AccountAuthenticators).为了成为一 个 认证器,一个类必须继承该类,提供抽象方法的实现,并且写

Android中文翻译 - AccountAuthenticatorActivity概述

AccountAuthenticatorActivity概述 这是一个抽象的用于实现activity的基类,常被用于帮助 抽象认证器 (AbstractAccountAuthenticator)的具体实现(implement).如果 抽象认证器AbstractAccountAuthenticator 需要使用一个activity去捕获请求,这是它可以 让一个activity来继承AccountAuthenticatorActivity. 抽象认证器AbstractAccountAuthentic

Android中文翻译 - AccountManagerFuture概述

AccountManagerFuture概述 一个AccountManagerFuture 表现了 异步的AccountManager调用的结果.它提供了一些方法用于判断计算是否完成,等待计算过程,和获得运算结果.当运算完成后,阻塞(如果需要的话)知道结果被准备好,结果只能被使用 get 方法获得.取消操作将被 cancel方法处理.额外的方法被提供为判断任务被正常完成或者被取消.一旦一个运算被完成,运算就不能被取消了.如果你为了可以取消的意图而不提供一个有用的结果的方式 来使用这个类,你可以声

【NLP】干货!Python NLTK结合stanford NLP工具包进行文本处理

干货!详述Python NLTK下如何使用stanford NLP工具包 作者:白宁超 2016年11月6日19:28:43 摘要:NLTK是由宾夕法尼亚大学计算机和信息科学使用python语言实现的一种自然语言工具包,其收集的大量公开数据集.模型上提供了全面.易用的接口,涵盖了分词.词性标注(Part-Of-Speech tag, POS-tag).命名实体识别(Named Entity Recognition, NER).句法分析(Syntactic Parse)等各项 NLP 领域的功能.

哈工大LTP云平台标记含义及性能

从官网搬过来的 囧rz 哈工大讯飞语言云 由哈工大 和科大讯飞 联合研发的中文自然语言处理云服务平台.结合了哈工大“语言技术平台——LTP” 高效.精准的自然语言处理核心技术和讯飞公司在全国性大规模云计算服务方面的 丰富经验,显著提升 LTP 对外服务的稳定性和吞吐量,为广大用户提供电信级稳定 性和支持全国范围网络接入的语言云服务,有效支持包括中小企业在内开发者的商 业应用需要. 作为基于云端的服务,语言云具有如下一些优势: 免安装:用户无需调用静态库或下载模型文件,只需要根据API参数集构造H

转:NLP+句法结构(三)︱中文句法结构(CIPS2016、依存句法、文法)

NLP+句法结构(三)︱中文句法结构(CIPS2016.依存句法.文法)转自:https://www.cnblogs.com/maohai/p/6453389.html 摘录自:CIPS2016 中文信息处理报告<第一章 词法和句法分析研究进展.现状及趋势>P8 -P11 CIPS2016> 中文信息处理报告下载链接:http://cips-upload.bj.bcebos.com/cips2016.pdf 一.依存句法分析 依存语法存在一个共同的基本假设:句法结构本质上包含词和词之间的

【HanLP】HanLP中文自然语言处理工具实例演练

HanLP中文自然语言处理工具实例演练 作者:白宁超 2016年11月25日13:45:13 摘要:HanLP是hankcs个人完成一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用.HanLP具备功能完善.性能高效.架构清晰.语料时新.可自定义的特点. 在提供丰富功能的同时,HanLP内部模块坚持低耦合.模型坚持惰性加载.服务坚持静态提供.词典坚持明文发布,使用非常方便,同时自带一些语料处理工具,帮助用户训练自己的语料.笔者坚定支持开源的项目,本文初衷是使用自然语言