词典资源:
SentiWordNet
《知网》中文版
中文情感极性词典 NTUSD
情感词汇本体下载
自然语言处理工具和平台:
哈尔滨工业大学社会计算与信息检索研究中心
isnowfy/snownlp · GitHub
汉语分词:
自然语言处理与信息检索共享平台 NLPIR.org
fxsjy/jieba · GitHub
语料资源:
信息分类与情感发现
课程:
斯坦福大学自然语言处理第七课“情感分析(Sentiment Analysis)”
网站和博客:
Text Classification for Sentiment Analysis
Second Try: Sentiment Analysis in Python : Andy Bromberg
Basic Sentiment Analysis with Python
论文:
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.244.9480&rep=rep1&type=pdf
工具:
建议使用Python. 集成上述所有功能,简单易学。
自己写过一个博客,基本有简单实现上述步骤,厚脸皮贴出。
Explore in Data
目前的状况下从题目上体现的三块应用来讲近场语音和面部识别差不多可以工业化了,目前比较大的几家都有成熟的技术应用,基本可以满足应用需求了,当然这两块技术还涉及到一些特殊场景目前技术覆盖不够,举个例子语音这块的远场方案还很差,另外面部识别这块如果时间跨度长的场景,效果还很差。(譬如童年照和现照对比这种的)但不可否认在在一些基础应用场景上已经达到了工业应用水准了。从目前公开api的两家来看,基本还是拿这场技术发展当大平台发展机遇来看的,不过目前应用层面还没有好的产品跟进,这一块会是一个不错的机会点。未完,待赞过10了再续。感谢大家点赞,回来再续一波重新审了一下题,先答题主的问题。如果题主要问这两个平台是否靠谱的话,我的建议的可以工业化应用的两块(语音识别和图像识别部分)都可以尽管尝试,另外语音合成模块也基本保障可用。其他的包括用户画像、推荐算法部分目前对用户本身数据依赖很大,考虑到平台的数据安全性,目前这块如非必要,需要考虑在保障数据安全的前提下应用。NLP等模块目前从算法能力上,包括具体应用上都还有很多问题,建议先观察一段时间。目前百度大脑对外应用上语音识别部分功能是一个十足亮点。如果题主想问的是微软和百度在算法能力上会有什么差别,目前公开API能力基本相近,而这些平台资源下能保障服务相对稳定,并可以容纳一定的吞吐量,如果题主希望在国内应用,推荐优先尝试百度大脑这边提供的能力。最后来是针对这类能力平台额外的一些废话目前企业内做算法主要有算法研究方向和应用导向两个方向,研究方向一般以企业内部研究院形式存在:如百度的IDL,另一块以应用导向性,譬如一线企业的算法团队或直接以人工智能为基础包装的新组织,这类结构一般是以针对某些场景的人工智能应用入手,进行算法积累和应用,创新和研究方向要弱于研究院。而基础能力开放平台一般都是由研究院这类组织推广,功能上目前可以应用的主要是针对现有产品的能力拓展,其他应用如机器学习、图谱建设、推荐等由于涉及到数据安全以及应用场景的限制,单纯的算法能力开放形式还需要市场验证。另外这类算法+资源的开放平台诞生本身说明了接下来阶段在应用层面算法、计算资源已经越来越不会在成为应用人工智能技术的瓶颈,针对行业的第一波应用创新的平台机遇近在眼前,之后新的机遇会随着算法攻关逐步攻克,在人工智能领域每一个技术的突破性进展都意味着在某几个领域会有突破性的产品变革。目前金融、硬件方向布局的企业有很多,智能技术应用事实上在后端已经有很多应用,但是在前端包装的产品特别在娱乐、社交、游戏等方向上有很多很多机会。