Nlpir Parser敏感词搜索灵玖语义技术应用

  近年来随着网络技术的飞速发展和用户的剧烈增长,网络传输数据量越来越大,网络用语越来越趋于多样化。如何快速的屏蔽用户的不当言论、过滤用户发表内容中的非法词汇已成为关键词匹配领域的一项重大难题。

  目前主要过滤技术,即数据库过滤、关键字过滤。由于数据库过滤方法对许多寄生在综合性网站内的不良信息无法过滤,对一些经常性地更改IP、URL,或采取多级代理方式的含有不良信息网站也无法过滤;基于关键字的不良信息过滤技术能获得较快的过滤速度,但往往不考虑上下文的关联性,漏报、错报率高,

  为了克服以上问题灵玖软件成功研发了Nlpir Parser智能平台敏感词搜索系统,它主要基于网络搜索、自然语言理解和文本挖掘的技术开发的基础工具集,可以导入大批量用户业务敏感的关键词列表,实现对内存与文件的实时智能扫描,生成命中的敏感关键词、敏感类别与权重等信息。

  Nlpir Parser智能平台敏感词搜索系统应用:

  1、敏感内容信息过滤

  可以设定敏感关键词,针对文章内容、信息关键词进行扫描,可以对敏感信息、事件、人物等信息进行剔除或抓取,适用于网站、出版、上网行为管理。通过针对特定关键词设定,可以过滤大量垃圾信息,净化互联网环境,适用于信息网站、各种论坛的信息整理。

  2、敏感账号扫描

  通过设定一个或一组敏感账号进行扫描,可以跟踪相关账号的传播路径、权重、受众群体及社会反响等互联网信息,适用于产品、人物跟踪。

  3、特定情报实时发现

  可以快速便捷地匹配大量自定义的业务关键词,智能发现不符合国家法律法规以及损害用户权益的内容,达到净化网络空间、提取信息的目的,确保国家、社会与个人的信息内容安全。

Nlpir Parser智能平台敏感词搜索系统提供二次开发接口,可以无缝地融合到客户的各类复杂应用系统之中,可兼容Windows,Linux, Android,Maemo5, FreeBSD等不同操作系统平台,可以供Java,C,C#等各类开发语言使用。

时间: 2024-10-08 08:46:11

Nlpir Parser敏感词搜索灵玖语义技术应用的相关文章

灵玖软件Nlpir Parser语义智能内容过滤

Internet是全球信息共享的基础设施,是一种开放和面向 所有用户的技术.它一方面要保证信息方便.快捷的共享;另一方面要防止垃圾信息的传播.网络内容分析是一种管理信 息传播的重要手段.它是网络信息安全核心理论与关键技术 研究网络内容分析所涉及的新理论.新体系结构.新方法和新技术. 内容过滤技术一般包括名单过滤技术.关键词过滤技术.图像过滤技术.模板过滤技术和智能过滤技术等.目前,内容过滤技术还处于初级阶段,实用的技术相对比较单一,主要表现在名单过滤和关键词过滤技术,而图像过滤与模板过滤技术还处

灵玖Nlpir Parser智能挖掘汉语精准分词

在中文自然语言处理中,词是最小的能够独立活动的有意义的语言成分.汉语是以字为基本书写单位,词语之间没有明显的区分标记,因此进行中文自然语言处理通常是先将汉语文本中的字符串切分成合理的词语序列,然后再在此基础上进行其它分析处理.中文分词是中文信息处理的一个基础环节,已被广泛应用于中文文本处理.信息提取.文本挖掘等应用中.分词涉及许多方面的问题,主要包括: (1). 核心词表问题:许多分词算法都需要有一个核心的(通用.与领域无关的)词表.凡在该词表中的词,分词时就应该切分出来.但对于哪些词应当收进核

大数据文本分析:灵玖自然语言中文语义分词系统

自然语言通常是指一种自然地随文化演化的语言.英语.汉语.日语为自然语言的例子,而世界语则为人造语言,即是一种为某些特定目的而创造的语言. 自然语言具备两个属性:语言属性与自然属性."语言"属性表现为公认的某些约定俗成的内在规律性;"自然"属性是说并不存在某个人为制造的.严格的语法规则体系来约定人们的语言表达方式,这是和程序设计语言大相径庭的.自然语言需要遵循一定的内在规律,但更大程度上是"存在即合理". 一个自然语言处理系统必须考虑许多语言自身与

语义挖掘:灵玖大数据汉语智能分词

自然语言处理(NLP,Natural Language Processing)是一个信息时代最重要的技术之一,简单来讲,就是让计算机能够理解人类语言的一种技术.在其中,分词技术是一种比较基础的模块,分词的意义非常大,在中文中,单字作为最基本的语义单位,虽然也有自己的意义,但表意能力较差,意义较分散,而词的表意能力更强,能更加准确的描述一个事物,因此在自然语言处理中,通常情况下词(包括单字成词)是最基本的处理单位. 汉语词技术对中文搜索引擎的查准率及查全率有重大影响.汉语词法分析中间件能对汉语语言

灵玖LJParser系统大数据语义挖掘的平台

大数据挖掘中最重要的是决定挖掘什么样的知识,这是在数据的收集.处理.挖掘的整个过程中都需要认真考虑的问题. 大数据技术涉及存储.搜索.传输.计算.挖掘等多方面.大数据挖掘旨在从大数据中挖掘出未知且有用的知识.通过挖掘,大数据的价值才得以体现,所以挖掘对大数据有着举足轻重的意义. 大数据挖掘有两个基本问题,即"挖什么(what to mine)"与"怎么挖(how to mine)".前者决定从数据中抽取什么样的信息,统计什么样的规律,后者决定怎样具体进行抽取与统计.

大数据挖掘:灵玖LJKeyScanner网络净化卫士

信息过滤是根据用户的信息需求,运用一定的标准和技术,从大量的动态信息流中将与用户无关的信息滤掉,把满足用户需求的信息提供给用户,从而减轻用户的认知负担,提高用户获取信息的效率. 随着科技的提高,互联网也得到了快速的发展,互联网发展到今天,已经得到很大的普及和应用.目前已经成为一个全球性.开放性.互动性的综合性平台.它容纳了各类型的原始信息,提供了各类型的服务,比如信息获取.网上购物.即时性信息交流等,给人们工作.生活带来很大的便利.可以说它深入人们的方方面面,是人类信息化技术的一次革命. 网络给

灵玖软件在中国出版领域大数据应用

随着当今世界互联网.移动互联网技术的高速发展,大数据也逐渐被诸多行业所应用.中国新闻出版研究院2013年发布的<2012-2013中国数字出版产业年度报告>中认为,大数据分析与挖掘将走进数字出版,是未来出版行业的发展趋势.对于出版行业来讲,这既是挑战更是难得的机遇. 新闻出版业的大数据应用,首先要厘清概念误区,明确区分大数据和"数据大"."统计分析"的逻辑关系;然后需要梳理新闻出版业的数据价值体系;同时需结合新闻出版业条数据.块数据同时并存.各有千秋的数

灵玖NLPIRParser大数据挖掘系统智能摘要

所谓自动文摘就是利用计算机自动地从原始文献中提取文摘,文摘是全面准确地反映某一文献中心内容地简单连贯的短文.常用方法是自动摘要将文本作为句子的线性序列,将句子视为词的线性序列. 灵玖NLPIRParser智能摘要是通过网页文本特殊的标签将需要的数据提供给搜索引擎,并在搜索结果中按照既定的模版展现的实现形式,目的是为了提升搜索结果的体验. NLPIRParser智能摘要能够实现文本内容的精简提炼,从长篇文章中自动提取关键句和关键段落,构成摘要内容,方便用户快速浏览文本内容,提高工作效率. NLPI

灵玖软件:大数据挖掘技术比数据更重要

数据与信息是重要的生产要素和战略资产,已在全球达成共识.然而,失去控制和无组织的数据和信息却不能很好地发挥战略资产的作用.信息挖掘是对文献.数据等信息资源对象进行分类.标引.描述.揭示,使之有序化.系统化的过程,其目的恰好是将无序的.分散的数据和信息整理成有序的信息资源,保证用户的有效获取和利用.因此,信息挖掘对于大数据资源的管理与利用具有重要作用. 同时,当前的大数据环境给信息挖掘带来了巨大的影响.正确地识别这些影响,对于凝练信息挖掘的研究方向.使其适应当前的发展环境.与国家的重大需求对接.为