社交网站的数据挖掘与分析 中文版 pdf

下载地址:网盘下载

内容简介  · · · · · ·

Facebook、Twitter和LinkedIn产生了大量宝贵的社交数据,但是你怎样才能找出谁通过社交媒介正在进行联系?他们在讨论些什么?或者他们在哪儿?这本简洁而且具有可操作性的书将揭示如何回答这些问题甚至更多的问题。你将学到如何组合社交网络数据、分析技术,如何通过可视化帮助你找到你一直在社交世界中寻找的内容,以及你闻所未闻的有用信息。

每个独立的章节介绍了在社交网络的不同领域挖掘数据的技术,这些领域包括博客和电子邮件。你所需要具备的就是一定的编程经验和学习基本的Python工具的意愿。

?获得对社交网络世界的直观认识

?使用GitHub上灵活的脚本来获取从诸如Twitter、Facebook和LinkedIn之类的社交网络API中的数据

?学习如何应用便捷的Python工具来交叉分析你所收集的数据

?通过XHTML朋友圈探讨基于微格式的社交联系

?应用诸如TF-IDF、余弦相似性、搭配分析、文档摘要、派系检测之类的先进挖掘技术

?通过基于HTML5和JavaScript工具包的网络技术建立交互式可视化

作者简介  · · · · · ·

马修·罗塞尔(Matthew A.Russell),Digital Reasoning Systems公司的技术副总裁和Zaffra公司的负责人,是热爱数据挖掘、开源和Web应用技术的计算机科学家。他也是《Dojo: The Dofinitive Guide》(O‘Reilly出版社)的作者。在LinkedIn上联系他或在Twitter上关注@ptwobrussell,可随时关注他的最新动态。

目录  · · · · · ·

前言1
第1章绪论:Twitter 数据的处理9
Python 开发工具的安装9
Twitter 数据的收集和处理11
小结24
第2章微格式:语义标记和常识碰撞26
XFN 和朋友27
使用XFN 来探讨社交关系29
地理坐标:兴趣爱好的共同主线37
(以健康的名义)对菜谱进行交叉分析41
对餐厅评论的搜集43
小结45
第3章邮箱:虽然老套却很好用47
mbox:Unix 的入门级邮箱48
mbox+CouchDB= 随意的Email 分析54
将对话线程化到一起70
使用SIMILE Timeline 将邮件“事件”可视化79
分析你自己的邮件数据82
小结84
第4章Twitter :朋友、关注者和Setwise 操作85
REST 风格的和OAuth-Cladded API86
干练而中肯的数据采集器90
友谊图的构建108
小结116
第5章Twitter:tweet ,所有的tweet ,只有tweet 118
笔PK 剑:和tweet PK 机枪(?!?)118
对tweet 的分析(每次一个实体)121
并置潜在的社交网站(或#JustinBieber VS #TeaParty)144
对大量tweet 的可视化155
小结163
第6章LinkedIn :为了乐趣(和利润?)将职业网络聚类164
聚类的动机165
按职位将联系人聚类167
获取补充个人信息183
从地理上聚类网络188
小结192
第7章Google Buzz:TF-IDF 、余弦相似性和搭配194
Buzz=Twitter+ 博客(???)195
使用NLTK 处理数据198
文本挖掘的基本原则201
查找相似文档208
在二元语法中发Buzz 215
利用Gmail 221
在中断之前试着创建一个搜索引擎……225
小结226
第8章博客及其他:自然语言处理(等)228
NLP :帕累托式介绍228
使用NLTK 的典型NLP 管线231
使用NLTK 检测博客中的句子234
对文件的总结237
以实体为中心的分析:对数据的深层了解245
小结256
第9章Facebook :一体化的奇迹257
利用社交网络数据258
对Facebook 数据的可视化274
小结294
第10 章语义网:简短的讨论296
发展中的变革296
人不可能只靠事实生活297
期望301

下载地址:网盘下载

原文地址:https://www.cnblogs.com/longgg/p/8465190.html

时间: 2024-10-09 01:53:30

社交网站的数据挖掘与分析 中文版 pdf的相关文章

社交网站的数据挖掘与分析(高清版)PDF

社交网站的数据挖掘与分析(高清版)PDF百度网盘链接:https://pan.baidu.com/s/1ia57ZMxvdTtq7eragsITzg 提取码:5hth 复制这段内容后打开百度网盘手机App,操作更方便哦内容简介 · · · · · · Facebook.Twitter和LinkedIn产生了大量宝贵的社交数据,但是你怎样才能找出谁通过社交媒介正在进行联系?他们在讨论些什么?或者他们在哪儿?这本简洁而且具有可操作性的书将揭示如何回答这些问题甚至更多的问题.你将学到如何组合社交网络数

社交网站的数据挖掘与分析

前言 1 第一部分 社交网络导引 序幕 13 第1章 挖掘Twitter:探索热门话题.发现人们的谈论内容等 15 1.1 概述 15 1.2 Twitter风靡一时的原因 16 1.3 探索Twitter API 18 1.4 分析140字的推文 33 1.5 本章小结 47 1.6 推荐练习 48 1.7 在线资源 48 第2章 挖掘Facebook:分析粉丝页面.查看好友关系等 50 2.1 概述 51 2.2 探索Facebook的社交图谱API 51 2.3 分析社交图谱联系 62 2

分享《Python机器学习—预测分析核心算法》高清中文版PDF+高清英文版PDF+源代码

下载:https://pan.baidu.com/s/1sfaOZmuRj14FWNumGQ5ahw 更多资料分享:http://blog.51cto.com/3215120 <Python机器学习-预测分析核心算法>高清中文版PDF+高清英文版PDF+源代码高清中文版,338页,带目录和书签,文字能够复制粘贴.高清英文版,361页,带目录和书签,文字能够复制粘贴.中英文两版对比学习.配套源代码.经典书籍,讲解详细. 其中,高清中文版如图所示: 原文地址:http://blog.51cto.c

《Python机器学习—预测分析核心算法》高清中文版PDF+高清英文版PDF+源代码

资源链接:https://pan.baidu.com/s/1J61jH-fqwGceoId6F8mr5Q<Python机器学习-预测分析核心算法>高清中文版PDF+高清英文版PDF+源代码高清中文版,338页,带目录和书签,文字能够复制粘贴.高清英文版,361页,带目录和书签,文字能够复制粘贴.中英文两版对比学习.配套源代码.经典书籍,讲解详细.其中,高清中文版如图所示: 原文地址:http://blog.51cto.com/14063572/2317037

学习《Python机器学习—预测分析核心算法》高清中文版PDF+高清英文版PDF+源代码

在学习和研究机器学习的时候,面临令人眼花缭乱的算法,机器学习新手往往会不知所措.从算法和Python 语言实现的角度,认识机器学习.专注于两类核心的"算法族",即惩罚线性回归和集成方法,并通过代码实例来展示所讨论的算法的使用原则.详细讨论预测模型的两类核心算法.预测模型的构建.惩罚线性回归和集成方法的具体应用和实现. 参考: <Python机器学习-预测分析核心算法>高清中文版PDF+高清英文版PDF+源代码 高清中文版,338页,带目录和书签,文字能够复制粘贴. 高清英文

Python数据挖掘入门与实践pdf

下载地址:网盘下载 内容简介  · · · · · · 本书作为数据挖掘入门读物,介绍了数据挖掘的基础知识.基本工具和实践方法,通过循序渐进地讲解算法,带你轻松踏上数据挖掘之旅.本书采用理论与实践相结合的方式,呈现了如何使用决策树和随机森林算法预测美国职业篮球联赛比赛结果,如何使用亲和性分析方法推荐电影,如何使用朴素贝叶斯算法进行社会媒体挖掘,等等.本书也涉及神经网络.深度学习.大数据处理等内容. 作者简介  · · · · · · 作者简介: Robert Layton 计算机科学博士,网络犯

旅游研究院大数据挖掘与分析科研平台建设方案

一. 背景 一.1 数据挖掘和大数据分析行业背景和发展趋势 移动互联网.电子商务以及社交媒体的快速发展使得企业需要面临的数据量成指数增长.根据 IDC <数字宇宙>(Digital Universe)研究报告显示,2020 年全球新建和复制的信息量已经超过 40ZB,是2015年的12倍;而中国的数据量则会在2020年超过8ZB,比2015年增长22倍.数据量的飞速增长带来了大数据技术和服务市场的繁荣发展.IDC亚太区(不含日本)最新关于大数据和分析(BDA)领域的市场研究表明,大数据技术和服

位居全球第四的社交网站 twitter暴病将死,你敢信吗?

"你所看到的,有时候并不是真的",我坚信这一点.正如twitter,我们看到的是它从开始仅有的50个用户到如今2.5亿活跃用户的惊人膨胀速度,曾一度将其与facebook相提并论,认为twitter终有一日能够像facebkook一样拥有12亿的庞大用户群体. 2013年11月,一直穷追猛赶的twitter选择上市,成为继facebook之后备受瞩目的上市公司之一.上市后,twitter股价以不可理喻的速度一路狂飙,截止12月底,短短一个月,曾一度飙升到74.73美元这个不现实的高点.

告诉你我为什么不喜欢上互联网社交网站

我不上QQ空间有差不多快6年了吧?微博也不发了半年多了(但偶尔会看 不能与时代信息完全脱轨嘛(-?-;)而人人就在高一的时候注册过 发布过一条状态后就注销了 觉得没意思 我倒不是特地为了远离网络而远离 就突然的觉得没意思 说实话没有这些并没有感觉自己的生活失去了什么缺少什么 我还是觉得自己有点依赖社交网络 我最怵的一种人就是把自己的什么隐私都放上网的人 特别是一条状态朋友圈空间微博人人齐同步 我想大多数人喜欢把自己生活什么暴露出来都是觉得自己过于重要了 我觉得关闭掉这些挺好的 我也没有觉得跟身边