粗糙的情感分析

import jieba
def judodd(num):
    if (num % 2) == 0:
        return "enev"
    else:
        return "odd"
def open_dict(Dict = "hhh",path = "D:\\"):
    path = path + "%s.txt" % Dict
    dictionary = open(path,"r",encoding = "utf8")
    dict = []
    for word in dictionary:
        word = word.strip("\n")
        dict.append(word)
    return dict
deny_word = open_dict(Dict = "否定词",path = "D:\\")
posword = open_dict(Dict = "positive", path = "D:\\")
negword = open_dict(Dict = "negative",path = "D:\\")
def emotion(file):
    seg_sentence = file.split("。")
    for sen in seg_sentence:
        segtmp = jieba.lcut(sen,cut_all = False)
        print(segtmp)
        i = 0
        a = 0
        for word in segtmp:
            if word in posword:
                count = 1
                c = 0
                for w in segtmp[a:i]:
                    if w in deny_word:
                        c += 1
                if judodd(c) == "odd":
                    count *= -1
                else:
                    count = 1
                a = i + 1
            elif word in negword:
                count = -1
                c = 0
                for w in segtmp[a:i]:
                    if w in deny_word:
                        c += 1
                if judodd(c) == "odd":
                    count *= -1
                else:
                    count = -1
                a = i + 1
            else:
                count = 0
            i += 1
    print(sen,count)
file = "我好开心啊，非常非常非常高兴！今天我得了一百分，我很兴奋开心，愉快，开心"
emotion(file)

时间： 2024-09-21 18:00:03

粗糙的情感分析的相关文章

C#编程实现朴素贝叶斯算法下的情感分析

C#编程实现这篇文章做了什么朴素贝叶斯算法是机器学习中非常重要的分类算法,用途十分广泛,如垃圾邮件处理等.而情感分析(Sentiment Analysis)是自然语言处理(Natural Language Progressing)中的重要问题,用以对文本进行正负面的判断,以及情感度评分和意见挖掘.本文借助朴素贝叶斯算法,针对文本正负面进行判别,并且利用C#进行编程实现. 不先介绍点基础? 朴素贝叶斯,真的很朴素朴素贝叶斯分类算法,是一种有监督学习算法,通过对训练集的学习,基于先验概率与贝叶

主题模型及其在文本情感分析中的应用

随着Web2.0技术的出现和发展,互联网上(包括门户网站.电子商务网站.社交网站.音/视频分享网站.论坛.博客.微博等)产生了海量的.由用户发表的对于诸如人物.事件.产品等目标实体的评论信息.例如,下面这两个短文本评论:(1)“比较了多个智能手机后选择了8150,性价比还可以.另外,就是考虑到它是3.7的屏幕,大小比较合适,否则携带很不方便.”(京东商城用户,2011.11.25):(2)“我以前在杭州做二手房地产,用温州炒房客的话说:全世界房价降了,杭州的房价永远不会降,因为他们有一道坚不可摧

文本情感分析的基础在于自然语言处理、情感词典、机器学习方法等内容。以下是我总结的一些资源。

词典资源:SentiWordNet<知网>中文版中文情感极性词典 NTUSD情感词汇本体下载自然语言处理工具和平台:哈尔滨工业大学社会计算与信息检索研究中心isnowfy/snownlp · GitHub 汉语分词:自然语言处理与信息检索共享平台 NLPIR.orgfxsjy/jieba · GitHub 语料资源:信息分类与情感发现课程:斯坦福大学自然语言处理第七课"情感分析(Sentiment Analysis)" 网站和博客:Text Classification

python snownlp情感分析简易demo

SnowNLP是国人开发的python类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于现在大部分的自然语言处理库基本都是针对英文的,于是写了一个方便处理中文的类库,并且和TextBlob不同的是,这里没有用NLTK,所有的算法都是自己实现的,并且自带了一些训练好的字典.注意本程序都是处理的unicode编码,所以使用时请自行decode成unicode.MIT许可下发行.其 github 主页我自己修改了上文链接中的python代码并加入些许注释,以方便你的理解: f

情感分析语料资源（免费）

1.知网的情感词典- http://www.keenage.com/html/c_bulletin_2007.htm由知网发布的词典,包括中文情感词典和英文情感词典 2.台湾大学的情感极性词典- http://www.datatang.com/data/11837包括2810个正极性词语和8276个负极性词语准确度很高 3.酒店评论语料- http://www.datatang.com/data/11936 谭松波整理的一个较大规模的酒店评论语料语料规模为10000篇语料从携程网上自动采集,并经

情感分析的现代方法（包含word2vec Doc2Vec）

英文原文地址:https://districtdatalabs.silvrback.com/modern-methods-for-sentiment-analysis 转载文章地址:http://datartisan.com/article/detail/48.html 情感分析是一种常见的自然语言处理(NLP)方法的应用,特别是在以提取文本的情感内容为目标的分类方法中.通过这种方式,情感分析可以被视为利用一些情感得分指标来量化定性数据的方法.尽管情绪在很大程度上是主观的,但是情感量化分析已经有

微博情感分析（一）

话说微博面世已经很久了,但对于微博信息的挖掘却才刚刚起步,这其中的原因当然有信息挖掘的技术还不成熟,但我觉得主要问题还是在于中文信息处理的技术还处于萌芽的阶段.中文语言本身信息量就很大,歧义性词汇多,再加上微博语言语义不整.微博媒介本体中夹杂着大量的标签,导致微博技术发展缓慢.在现在的网络上,用户通过网络主动地表达自己的观点或对其他人或事件的态度,主观性强:微博载体规定的语言只有140字,使信息在微博中呈现出碎片化.即时化和移动化的特性,而不再是具有完整的上下文信息.通过微博自由.便捷.即时地抒

如何用KNIME进行情感分析

Customer Intelligence Social Media Finance Credit Scoring Manufacturing Pharma / Health Care Retail Cross Industry Government Credit Scoring / Credit Rating / Customer Risk (This workflow can be found on the KNIME Workflow Public Server under 0

短文本情感分析

一.什么是情感分析: 情感分析(SA)又称为倾向性分析和意见挖掘,它是对带有情感色彩的主观性文本进行分析.处理.归纳和推理的过程,其中情感分析还可以细分为情感极性(倾向)分析,情感程度分析,主客观分析等. 情感极性分析的目的是对文本进行褒义.贬义.中性的进行判断. 情感程度分析主要是对同一情感极性中再进行划分或者细分,以描述该极性的强度.例如"喜爱"和"敬爱"都是褒义词,但是"敬爱"相对来说褒义的程度更加强烈一些. 主客观分析主要目的是识别文本中

猜你喜欢

TTL,COMS,USB,232,422,485电平之详细介绍及使用

如有错误敬请指导! 今天来详细介绍一下TTL,COMS,USB,232,422,485电平,以及之间的转换问题. 有些地方的引脚图可能不是规范的,具体引脚以自己的模块资料为主,这篇文章着重介绍使用.. ...

Linux学习之探索文件系统

Linux,一起学习进步- ls With it, we can see directory contents and determine a variety of important file an ...

求一个字符串中连续出现次数最多的子串

解题思路例如字符串"abababc",最多连续出现的为ab,连续出现三次.要和求一个字符串中的最长重复子串区分开来,还是上面的字符串,那么最长的重复子串为abab.两个题目的解法 ...

培训讲座|Microsoft Azure，助您轻装前行

在移动互联的时代大势下,IT服务的蓬勃发展对企业信息系统后台架构提出了重大挑战.微软智能云Azure,能够帮助企业免除昂贵的硬件设施及人力成本开销,助您轻装前行. 2016年7月21日,福州微软孵化器 ...

Python爬虫学习笔记（一）

1.urllib2简介 urllib2的是爬取URL(统一资源定位器)的Python模块.它提供了一个非常简单的接口,使用urlopen函数.它能够使用多种不同的协议来爬取URL.它还提供了一个稍微复 ...

HTML笔记（二）在HTML中使用CSS

外部CSS: <head> <link rel="stylesheet" type="text/css" href="mystyle ...

[Erl_Question07] Erlang 做图形化编程的尝试：纯Erlang做2048游戏

用Erlang久了,以为erlang做类似于As3,JS的图形化界面是绝对不可能的,多少次,多少次想用erlang做个炫酷的图形游戏.终于:折腾出来了结果:纯Erlang也可以做到! 因为以前接触过W ...

Lambda表达式的使用

在C#中,Lambda表达式运用的是Func<T>等泛型常用的有 Func<TResult> 委托 out TResult 此委托封装的方法的返回值类型. Func<T ...

Performing Time-Based or Change-Based Incomplete Recovery

OCP 053: 192.What is the purpose of the until change option of the restore command? A. It allows you ...

Java同步并发容器类

同步容器同步容器类包括vector和Hashtable.此外还包括jdk1.2中添加的一些功能相似的类,这些同步封装器是由Collections.synchronizedXxx等工厂方法创建的.这些 ...

嵌入式第三次课

嵌入式软件设计第3次实验报告学号:140201225 姓名:刘曦洋组别:第1组实验地点:D19 一.实验目的: 1.掌握STM32固件库函数 ...

JSONP跨域的原理解析及其实现介绍

JSONP 即 Json padding ,JSONP跨域GET请求是一个常用的解决方案,下面我们来看一下JSONP跨域是如何实现的,并且探讨下JSONP跨域的原理 JavaScript是一种在Web ...

DNS Prefetch初认识

今天在看一个后台框架时,发现这样的代码: <link rel="dns-prefetch" href="//0.s3.envato.com">< ...

封装的ajax请求

在做登录注册这类提交表单数据时,我们经常需要局部刷新网页来验证用户输入的信息,这就需要用到ajax请求,我们通常需要获取表单中的数据,发起ajax请求,通过服务程序,与数据库的数据进行比对,判断信息的 ...

采用handle消息机制实现轮播效果

1 // 自动轮播条显示 2 if (mhandle == null) { 3 mhandle = new Handler() { 4 public void handleMessage(Messag ...

《Linux系统基础》课堂随笔3 7.20

Esc+.(句号):快速书写上次已经写过的路径命令行查看的几种命令: cat : tac:(cat的倒写) more : 分页显示文本文件单向 [常和管道符一起用] less:分页显示文本文件 ...

【STL基础】deque

deque (double-ended queue) 构造函数: //default: deque<T> d; //空的vector //fill: deque<T> d(n) ...

nginx软负载的搭建

Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器,也是一个 IMAP/POP3/SMTP 代理服务器,在高连接并发的情况下Nginx 是 Apa ...

unity绘制线和绘制面

绘制线条代码,其实就是指定至少两个点,然后赋予贴图即可,不废话,上代码: using UnityEngine; using System.Collections; public class LineT ...

语音识别概率问题，一段在数学之美了看到的话

如果 S 表示一连串特定顺序排列的词 w1, w2,…, wn ,换句话说,S 可以表示某一个由一连串特定顺序排练的词而组成的一个有意义的句子.现在,机器对语言的识别从某种角度来说,就是想知道 S 在 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 12 q. 0.103 s.