文本情感分析的基础在于自然语言处理、情感词典、机器学习方法等内容。以下是我总结的一些资源。

词典资源:
SentiWordNet
《知网》中文版
中文情感极性词典 NTUSD
情感词汇本体下载

自然语言处理工具和平台:
哈尔滨工业大学社会计算与信息检索研究中心
isnowfy/snownlp · GitHub

汉语分词:
自然语言处理与信息检索共享平台 NLPIR.org
fxsjy/jieba · GitHub

语料资源:
信息分类与情感发现

课程:
斯坦福大学自然语言处理第七课“情感分析(Sentiment Analysis)”

网站和博客:
Text Classification for Sentiment Analysis
Second Try: Sentiment Analysis in Python : Andy Bromberg
Basic Sentiment Analysis with Python

论文:
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.244.9480&rep=rep1&type=pdf

工具:
建议使用Python. 集成上述所有功能,简单易学。

自己写过一个博客,基本有简单实现上述步骤,厚脸皮贴出。
Explore in Data

目前的状况下从题目上体现的三块应用来讲近场语音和面部识别差不多可以工业化了,目前比较大的几家都有成熟的技术应用,基本可以满足应用需求了,当然这两块技术还涉及到一些特殊场景目前技术覆盖不够,举个例子语音这块的远场方案还很差,另外面部识别这块如果时间跨度长的场景,效果还很差。(譬如童年照和现照对比这种的)但不可否认在在一些基础应用场景上已经达到了工业应用水准了。从目前公开api的两家来看,基本还是拿这场技术发展当大平台发展机遇来看的,不过目前应用层面还没有好的产品跟进,这一块会是一个不错的机会点。未完,待赞过10了再续。感谢大家点赞,回来再续一波重新审了一下题,先答题主的问题。如果题主要问这两个平台是否靠谱的话,我的建议的可以工业化应用的两块(语音识别和图像识别部分)都可以尽管尝试,另外语音合成模块也基本保障可用。其他的包括用户画像、推荐算法部分目前对用户本身数据依赖很大,考虑到平台的数据安全性,目前这块如非必要,需要考虑在保障数据安全的前提下应用。NLP等模块目前从算法能力上,包括具体应用上都还有很多问题,建议先观察一段时间。目前百度大脑对外应用上语音识别部分功能是一个十足亮点。如果题主想问的是微软和百度在算法能力上会有什么差别,目前公开API能力基本相近,而这些平台资源下能保障服务相对稳定,并可以容纳一定的吞吐量,如果题主希望在国内应用,推荐优先尝试百度大脑这边提供的能力。最后来是针对这类能力平台额外的一些废话目前企业内做算法主要有算法研究方向和应用导向两个方向,研究方向一般以企业内部研究院形式存在:如百度的IDL,另一块以应用导向性,譬如一线企业的算法团队或直接以人工智能为基础包装的新组织,这类结构一般是以针对某些场景的人工智能应用入手,进行算法积累和应用,创新和研究方向要弱于研究院。而基础能力开放平台一般都是由研究院这类组织推广,功能上目前可以应用的主要是针对现有产品的能力拓展,其他应用如机器学习、图谱建设、推荐等由于涉及到数据安全以及应用场景的限制,单纯的算法能力开放形式还需要市场验证。另外这类算法+资源的开放平台诞生本身说明了接下来阶段在应用层面算法、计算资源已经越来越不会在成为应用人工智能技术的瓶颈,针对行业的第一波应用创新的平台机遇近在眼前,之后新的机遇会随着算法攻关逐步攻克,在人工智能领域每一个技术的突破性进展都意味着在某几个领域会有突破性的产品变革。目前金融、硬件方向布局的企业有很多,智能技术应用事实上在后端已经有很多应用,但是在前端包装的产品特别在娱乐、社交、游戏等方向上有很多很多机会。

时间: 2024-11-19 00:46:05

文本情感分析的基础在于自然语言处理、情感词典、机器学习方法等内容。以下是我总结的一些资源。的相关文章

文本情感分析(一):基于词袋模型(VSM、LSA、n-gram)的文本表示

现在自然语言处理用深度学习做的比较多,我还没试过用传统的监督学习方法做分类器,比如SVM.Xgboost.随机森林,来训练模型.因此,用Kaggle上经典的电影评论情感分析题,来学习如何用传统机器学习方法解决分类问题. 通过这个情感分析的题目,我会整理做特征工程.参数调优和模型融合的方法,这一系列会有四篇文章.这篇文章整理文本特征工程的内容. 文本的特征工程主要包括数据清洗.特征构造.降维和特征选择等. 首先是数据清洗,比如去停用词.去非字母汉字的特殊字符.大写转小写.去掉html标签等. 然后

自然语言11_情感分析

http://blog.csdn.net/erli11/article/details/23918751 斯坦福大学自然语言处理第七课"情感分析(Sentiment Analysis)" 转自:52opencourse.com/ http://52opencourse.com/235/%E6%96%AF%E5%9D%A6%E7%A6%8F%E5%A4%A7%E5%AD%A6%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E5%A4%84%E7%90%86%E7

2016年,文本分析、情感分析和社交分析的10大趋势

文本分析.情感分析和社交分析帮助你在一定规模上转化成客户.病人.公众以及市场的“声音”.这项技术目前大量地应用于一系列的工业产品中,从医疗健康到金融.媒体.甚至客户市场.它们从线上.社交网络.企业数据源中提取商业洞察力. 它从文本中.音频中.图像中还有网络连接中提取洞察力,它可真是个有用的东西! 目前分析技术发展得还是相当不错的,尽管在某些领域,例如数字分析和市场研究有些稍稍落后.但是甚至是在例如“客户体验.社群聆听.用户交互”方面,还是有很多发展空间.这个快速发展的市场空间无论对于新加入的玩家

情感分析的现代方法(包含word2vec Doc2Vec)

英文原文地址:https://districtdatalabs.silvrback.com/modern-methods-for-sentiment-analysis 转载文章地址:http://datartisan.com/article/detail/48.html 情感分析是一种常见的自然语言处理(NLP)方法的应用,特别是在以提取文本的情感内容为目标的分类方法中.通过这种方式,情感分析可以被视为利用一些情感得分指标来量化定性数据的方法.尽管情绪在很大程度上是主观的,但是情感量化分析已经有

C#编程实现朴素贝叶斯算法下的情感分析

C#编程实现 这篇文章做了什么 朴素贝叶斯算法是机器学习中非常重要的分类算法,用途十分广泛,如垃圾邮件处理等.而情感分析(Sentiment Analysis)是自然语言处理(Natural Language Progressing)中的重要问题,用以对文本进行正负面的判断,以及情感度评分和意见挖掘.本文借助朴素贝叶斯算法,针对文本正负面进行判别,并且利用C#进行编程实现. 不先介绍点基础? 朴素贝叶斯,真的很朴素 朴素贝叶斯分类算法,是一种有监督学习算法,通过对训练集的学习,基于先验概率与贝叶

情感分析简述

情感分析,我研究了也有半年有余了,号称看遍ACL上关于情感分析的论文,但是到目前还没有什么成就的.以下是我为一位同学毕业设计写的情感分析方面的综述,引用的论文基本上是ACL和COLING还有EMNLP上历年关于情感分析的论文,本文应该学术性比较强一点,本文虽不打算发表,但由于将来可能还有用,以及关于学术上的原因,请大家如果要引用请务必标明出处(http://blog.sina.com.cn/s/blog_48f3f8b10100irhl.html). 概述 情感分析自从2002年由Bo Pang

Python爬虫和情感分析简介

摘要 这篇短文的目的是分享我这几天里从头开始学习Python爬虫技术的经验,并展示对爬取的文本进行情感分析(文本分类)的一些挖掘结果. 不同于其他专注爬虫技术的介绍,这里首先阐述爬取网络数据动机,接着以豆瓣影评为例介绍文本数据的爬取,最后使用文本分类的技术以一种机器学习的方式进行情感分析.由于内容覆盖面巨大,无法详细道尽,这篇文章旨在给那些对相关领域只有少量或者没有接触的人一个认知的窗口,希望激发读者自行探索的兴趣. 以下的样本代码用Pyhton写成,主要使用了scrapy, sklearn两个

R语言︱监督算法式的情感分析笔记

笔者寄语:本文大多内容来自未出版的<数据挖掘之道>的情感分析章节.本书中总结情感分析算法主要分为两种:词典型+监督算法型. 监督算法型主要分别以下几个步骤: 构建训练+测试集+特征提取(TFIDF指标)+算法模型+K层交叉验证.可与博客对着看:R语言︱词典型情感分析文本操作技巧汇总(打标签.词典与数据匹配等) ------------------------------------------------ 一.TFIDF算法指标的简介 监督式算法需要把非结构化的文本信息转化为结构化的一些指标,

主题模型及其在文本情感分析中的应用

随着Web2.0技术的出现和发展,互联网上(包括门户网站.电子商务网站.社交网站.音/视频分享网站.论坛.博客.微博等)产生了海量的.由用户发表的对于诸如人物.事件.产品等目标实体的评论信息.例如,下面这两个短文本评论:(1)“比较了多个智能手机后选择了8150,性价比还可以.另外,就是考虑到它是3.7的屏幕,大小比较合适,否则携带很不方便.”(京东商城用户,2011.11.25):(2)“我以前在杭州做二手房地产,用温州炒房客的话说:全世界房价降了,杭州的房价永远不会降,因为他们有一道坚不可摧