智能大数据SMART准则(读书笔记)

引言部分

1、智能渔业

将微型传感器安置到鱼身上,用意追踪任何特定时间的鱼群位置,并运用声呐探测鱼群密度以及何时何地撒网

2、智能运动

英式橄榄球队员都有一个GPS追踪系统,使得假脸人员能够知道每一个队员的情况

3、智能保健

类似Ginger.io等云服务以及可以通过消费则手机中安装的应用,检测患者的身体情况。Proteus公司制作的一款尺寸只有一粒沙大小的“可吞服”传感器,可以追踪患者服药的时间和方式

4、智能家居

来生长谈了

5、智能恋爱

通过大数据分析,得到模型,再通过模型对所有的人进行配对

6、智能育儿

比如最新一代的尿不湿可以通过分析尿样,提醒父母当前婴儿的身体状况

商业智能化

1、沃尔玛

例如,如果你从沃尔玛买了烧烤相关的产品,你的位置处在局里一家沃尔玛门店3英里半径的范围内,且阳光明媚,沃尔玛就会向你的手机发送一张烧烤架清洁剂打折券

2、非结构化的数据

研究告诉我们,公司实际用来进行决策的信息不足20%。而且,这20%也仅仅是传统的结构化KPI或财务数据。如果能把非机构化数据也利用起来,那么价值会超乎想象

制定智能战略

当你从制定战略起步,那么你明白需要什么,进而决定手机什么数据来解答问题

明确需要什么信息,能得到且会用到的信息是什么,然后建造时间上最小、最直接的数据库

有一句话可能经常听得到“嗯,最好不要丢掉任何东西,说不定未来能用上”。但是这句话需要分清场合,比如在数据上,数据是有声明周期的,与其让不断增加的信息给你施压,不如忘掉五年前的数据库,但是更重要的是,退后一步,问问自己什么才是最重要的。然后,用得到的结论指引行动和选择数据。

实践中的SMART战略板

a、目的面板

战略目的,最终想要把公司做成什么样

b、客户面板

需要考虑两方面----目标市场和价值主张,简单来说就是明确客户为什么从你这里买东西?

c、财务面板

提高公司的营收

d、运营面板

培养核心竞争力----需要在哪些内部环节做到最好?(产品/服务研发,创造需要,满足需要,监管和社会关系等)

e、资源面板

你需要什么IT系统和数据才能完成战略目标,什么样的人才能帮助完成这样的IT系统和什么样的工具能得到这样的数据?

f、竞争和风险面板

你该想想在实现战略的过程中,会面临哪些挑战和风险

度量指标和数据

非结构化数据和半结构化数据

代表着所以不被轻易插入列、行,以及字段和数据。样例包括:照片和图形图像、视频录像、网址、文本或者诸如电子邮箱、pdf、博客、社交媒体的帖子等、ppt。这样的数据中存在某些可以用于分析的结构,但是缺乏严格的数据模型结构。例如,Facebook上的帖子可以根据作者、数据、长度甚至是情感进行分类,但是其内容通常是非结构化的。

数据化的许多东西都在影响着我们

例如读书的数据,我们读了什么,读了多久,是否跳读了,在哪一页做了批注,以及在哪里进行了高亮标注。这些信息对作者和出版商都有用。这会让其他作者对内容进行调整来缩短或改进特定部分的内容,从而使读者更好地进行阅读体验。另外,作者和出版商可能会从各种书籍经常被划重点的段落中辨别读者们的兴趣所在,判断新的话题走向趋势

举个例子,2013年台风席卷菲律宾过后,志愿者平均每天都会受到数以百万计的照片、短信和视频等。通过准确找出改数据来自菲律宾的哪个地方(通过照片或者是文本发放的gps传感器来定位),然后志愿者们就制成一个在线地图,当灾区救援队来的时候,他们不需要花时间去就知道哪个受灾地方最严重了

传感器的数据

貌似每一本这类的书总是会提...

物联网给未来创造了不少的可能

如果一个早会取消了,你的电脑就会自动设置成一个晚一点的工作,也会将你的咖啡机推迟到一个新的叫醒时间。你的冰箱会知道它里面有什么东西,并且不需要你做任何事情,你的冰箱就会自动在网上下订单来填满存货

大数据的分解

确认你需要测量的数据(有个逻辑的等级)

a、内部结构数据,这是最容易找到并最容易进行分析的

b、内部半结构化数据

c、内部非结构化数据

d、外部结构化数据

e、外部非结构化数据

比如你可以想一想,以下的数据能帮助到你完成你的课题吗?

a、调查调研数据

b、销售和事件物数据

c、眼球追踪数据

d、运行数据需求

e、供应数据

f、财经数据

g、金融交易数据

h、股票市场数据

i、现金流数据

j、招聘数据、找工作的数据

运用数据分析技术

文本分析方法,典型的文本分析方法包括

1、文本归类

将一些结构归到文本中,这样就可以用于分析和查询,比如垃圾邮件归类

2、文本收集

文本手机允许你自动手机文本中大量的知识库,并将其转化成有意义的快速获取信息或者过滤的主题或者类别

3、概念提取

现在被很多法律公司用于商务领域,这些法律公司有成百上千的法律文件需要处理。概念提取分析法可以导向目标追踪文件里很可能与新情况最相关的问价,这样就会给认识部分节省大量宝贵的时间来将之前的数据进行定位

4、情感分析

也成为观点挖掘,它竭力从文本中提取主观的观点或者情感,比如使用twitrratr工具对星巴克公司的情感分析;例如,运动饮料公司Gatorade利用一系列的话题来检测博客的对话内容,并展示博客圈的这些对话有多火。该公司也对重要的话题、产品,以及竞选会动进行具体的情感分析。他也追踪与品牌(包括竞争者、运动员以及体育营养类的主题)相关的词汇。基本上,Gatorade公司知道全世界的人们对其冻死以及公司的产品说了什么

5、文本概括

这个文本分析工具允许你利用电脑程序自动总结文件内容,来保留源文件中最重要的内容。这种自动归纳有两种方法:提取和摘要。

视频和图像分析技术

1、谷歌的NameTag,用户只需要通过谷歌眼镜中的NameTag应用看一下陌生人,就会立即得到一条包含陌生人姓名、职业和Facebook上个人介绍完全匹配的信息

2、一些公司不仅仅是分析单个图像,而且还在通过一组图像分析变化。例如,可以发现你当前上传的图片和之前的比较是胖了还是瘦了,是开心还是悲伤

联合分析技术

把各个分析技术联合起来使用

被点赞说明了什么

Facebook上别人给你点的赞可以用来揭示与你有关的许多私密的细节、性格特点和偏好,这些属性在其他情况下你是不能与他们分享的。剑桥大学和微软研究实验室的一项研究为我们展示出,Facebook上类似点赞等模式是如何能够自动且精确地预测大量高敏感度的个人特质的。该研究最终表明,点。很小或几乎没有,通常,一个赞就能产生精确预测。比如赞了科学、莫扎特一次说明你智商高

得到了你的性格特点之后,还可以做更多有趣的事情,比如可以推送一些商品或者书籍。

最后

数据分析时,对信息使用的目的和手段要保持诚实和透明度---对客户尤其如此

为提供数据的人增加价值,记住这么做是公平且值得的。

数据可视化

1、柱状图

2、线条图

3、饼形图

4、散布图

许多新老工具都可以进行数据可视化,但可视化不是目标。漂亮的图标仍然可能毫无意义。我们包装的信息要能够讲故事。最好的方式来讲故事,可以通过以下途径

1、展示地图

假如你需要展示一系列发杂的数据集,那么如果数据在地图上以叠加的方式呈现,你的故事就能更简明、清晰。可以参考polymaps。

2、展示文本

基于词云的最常见的感情展示

3、展示数据

D3.js可以多样式的展示数据

3、展示行为和情绪

现在我们能知道一个网站的热点在哪里,一首歌是什么形状

4、展示关联

成功的数据可视化的和信息图的要素

1、确定你的目标首宗

2、定制数据可视化方案

3、给数据可视化一个清晰的标签或标题

4、强数据可视化和你的策略联系起来

5、明智地选择你的展示图表

6、使用标题让重点突出

7、在恰当出添加文字说明

重点和行动纲领

1、更好地理解并定位客户

2、改进优化业务流程

3、提高人们的健康和幸福水准

4、增强安全性,减少欺诈

5、鼓励提高企业和员工业绩

6、改善工作场所和其他基础设施的条件

结论

1、不要一开始就着眼于数据。如果你这么做了,就会发现自己深陷在满是选择无法脱身的状态中。实现要注意的是战略,要弄清楚自己需要知道什么,为什么要知道这些,在将这些死开结果和你的长期战略与短期战术目标联系起来

2、清楚了自己目标之后,就可以开始找达到这些目标的数据。如果能帮你解决问题的有三种数据来源,那么就集中精力于你已有或最容易得到的那类数据上。

3、记住,一定要从已有易得的结构良好的内部数据开始,相对于结构不良的外部数据,前者更容易分析。

4、有了数据就要考虑分析了

5、分析完毕之后,就要考虑怎样将这些数据进行展示了

6、最后在判断是否达到自己的目标来改变前面步骤的内容

时间: 2024-07-30 02:52:22

智能大数据SMART准则(读书笔记)的相关文章

《大数据时代》读书笔记

大数据开启了一次重大的时代转型.就像望远镜让我们能够感受宇宙,显微镜让我们能够 观测微生物一样,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源 泉,而更多的改变正蓄势待发-- 大数据的精髓在于我们分析信息时的三个转变,这些转变将改变我们理解和组建社会的方法. 第一个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和第一个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和 某个特别现象相关的所有数据,而不再依赖于随机采样. 某个特别现象相关的

《大数据营销》读书思考

这是一本营销领域里边讲技术的书,也是讲技术里边完全讲营销的书.适合的读者职业主要有:咨询,售前,产品经理,BD.......        全书的整个脉络有6章,其中的干货主要是在前四章.而第一章就占有半本书之多.而个人比较喜欢的是三,四章的内容,可能也跟自己的工作有关系吧.有很多干货,同时对一些常规理念有较大突破.前两章里边对一些技术实现也有所提及.看完这本书,就好像你突然间明白了互联网为什么那么看重数据?以及数据为当下及未来的营销能带来哪些改变.同时对传统行业的数据决策思维也有很大帮助.  

《大数据运营》读书分享会活动

本周四(7.5)20:00-21:00,我与大家在线分享<大数据运营>图书的精要内容,同时植入区块链与大数据融合创新.互联网与区块链思维等新的知识点,欢迎大家关注.交流. 新增知识点之一:[区块链与大数据融合创新思考]大数据是生产资料,是新能源,但是大数据行业最大的问题和困难是:组织之间的数据难以流通和共享,如果这一问题得不到解决,数据就难以释放能量并创造更大的价值.数据难以流通和共享的主要原因是数据的开放可能会触犯个人隐私或者引发安全问题,也就是说当前还没有一种很好的办法解决由数据开放引起的

智能大数据和网络营销的碰撞

在企业服务领域,有人认为有这样五大怪兽级别的企业,它们是BATJH.BAT当然是指百度.阿里.腾讯三大互联网巨头,而J则是最近与腾讯大战数百回合而不落下风的今日头条,至于H则是指知识产权界的独角兽--汇桔网. 与BATJ所依靠的互联网时代不同,汇桔网依托和打造的是"知联网"时代,即"知识产权×互联网平台×智能物联网"的生态模式与未来趋势.因此在时间上,汇桔网刚好稍晚于BATJ等互联网公司,到2013才应运而生,至今也已有5个年头. 以企养企:企业服务与企业DNA 

《大数据时代》简要笔记

一.大数据时代处理数据理念上的三大转变 1.要全体不要抽样(不用随机的方法,而是采用所有的数据) 2.要效率不要精确(接受数据的不精准和不完美,反而可以更好的进行预测,适用于精确度不要求那么极端的任务) 3.要相关不要因果(不一定非要知道原因,只要知道结果) 二.面对新领域和新概念应有的态度 1.努力在可以应用,可以扩展的地方应用它扩展它 2.在不能应用的地方,就停下来 三.处理技术 1.谷歌的MapReduce和开源的Hadoop平台 2.数据不需要用传统的数据库表格来整齐的排列,如NoSQL

类库开发的设计准则 读书笔记 2类型设计准则

MSDN链接:http://msdn.microsoft.com/zh-cn/library/vstudio/ms229036(v=vs.100).aspx 系列文章列表: 1名称准则:http://www.cnblogs.com/liu-meng/p/4181984.html 2类型设计准则:http://www.cnblogs.com/liu-meng/p/4182737.html 类型与命名空间: 使用命名空间将类型组织到相关功能区域的的层次结构中 避免使用较深的命名空间层次结构 避免使用

类库开发的设计准则 读书笔记 1名称准则

MSDN链接:http://msdn.microsoft.com/zh-cn/library/vstudio/ms229042(v=vs.100).aspx 系列文章列表: 1名称准则:http://www.cnblogs.com/liu-meng/p/4181984.html 2类型设计准则:http://www.cnblogs.com/liu-meng/p/4182737.html 大小写的样式: Pascal 大小写 将标识符的首字母和后面连接的每个单词的首字母都大写. 可以对三字符或更多

阿里爸爸大数据的应用与展望(笔记)

阿里全息大数据构建与应用笔记 阿里全息大数据构建与应用笔记 这个双十一你剁手了吗?→_→反正我的手机是收到了来自阿里爸爸的各种短信轰炸- 然而在购物之余,你又是否能够回答这么几个问题:电商是如何应用在大数据相关技术的?大数据给在线营销带来了怎么样的变革?在线购物体验在过去几年发生了怎么样的变化? 那么接下来就来看看大数据与在线营销能擦出怎样的火花- 1.数据的进化历程 ①大数据与数据的区别 ○量大,如果你只有几千条几百条的数据,还不好意思叫大数据 ○彼此关联,如果你的数据东一个西一个没什么关联,

第二篇:智能电网(Smart Grid)中的数据工程与大数据案例分析

前言 上篇文章中讲到,在智能电网的控制与管理侧中,数据的分析和挖掘.可视化等工作属于核心环节.除此之外,二次侧中需要对数据进行采集,数据共享平台的搭建显然也涉及到数据的管理.那么在智能电网领域中,数据工程到底是如何实施的呢? 本文将以IBM的Itelligent Utility Network产品为例阐述智能电网中的数据工程,它是IBM声称传统电网向智能电网转变的整体方案(看过上篇文章的童鞋想必会清楚这样的说法是片面狭隘的,它只能算是智能电网中的数据工程). 另一方面,如今是一个数据爆炸的时代,