数据分析 大数据之路 一

数据分析 大数据之路 一的相关文章

数据分析 大数据之路 三 numpy 2

NumPy 数学函数 NumPy 提供了标准的三角函数:sin().cos().tan() numpy.around() 函数返回指定数字的四舍五入值 numpy.floor() 返回数字的下舍整数 numpy.ceil() 返回数字的上入整数 NumPy 算术函数 NumPy 算术函数包含简单的加减乘除: add(),subtract(),multiply() 和 divide() numpy.reciprocal() 函数返回参数逐元素的倒数.如 1/4 倒数为 4/1. numpy.pow

数据分析 大数据之路 五 pandas 报表

pandas:  在内存中或对象,会有一套基于对象属性的方法,   可以视为 pandas 是一个存储一维表,二维表,三维表的工具, 主要以二维表为主 一维的表, (系列(Series)) 二维的表,DataFrame, 也叫报表 三维的表,(面板(Panel)) 文本格式 : CSV 以文本方式存储,  item 之间用逗号分割,记录与记录之间以回车分开 , 可以用 excel 方式打开 json 格式 , 以 key ,value 方式存储 import numpy as np import

胖子哥的大数据之路(11)-我看Intel&&Cloudera的合作

一.引言 5月8日,作为受邀嘉宾,参加了Intel与Cloudera在北京中国大饭店新闻发布会,两家公司宣布战略合作,该消息成为继Intel宣布放弃大数据平台之后的另外一个热点新闻.对于Intel的放弃早在预料之中,对于Intel与Cloudera合作也在意料之中,但是没有想到的是居然那么快.壮士断腕的Intel反倒让我看出几分勇气可嘉来,Cloudera的顺势而为,也被我所认同,Intel借助Cloudera的技术能力,Cloudera借用Intel的商务平台,然后彼此合作真的就能够成功?换句

胖子哥的大数据之路(12)-三张图告诉你大数据安全方案设计

一.引言: 最近一直很忙,在做一个全国性项目的IT架构,所以一直没有更新,好在算是告一段落,继续努力吧.项目沟通中过程客户反复在强调,大数据的安全性,言下之意,用了大数据,就不安全了,就有漏洞了.所以花了些时间,针对大数据的安全设计做了一个总结,算是阶段性的成果吧,分享给大家. 二.安全架构 大数据安全架构主要从六个方面考虑,包括物理安全.系统安全.网络安全.应用安全.数据安全和管理安全六个维度.物理安全强调物理硬件的国产化,避免类似美国轰炸伊拉克悲剧的重演,这也算是一个国家战略的产物,虽未正式

行在说 | 从阿里巴巴大数据之路看企业中台战略

戳右方链接观看精彩视频从阿里巴巴大数据之路看企业中台战略 视频导读: 提到阿里巴巴,我们首先想到的是一家电商互联网企业,淘宝.天猫.支付宝等一系列平台和产品已经彻底改变了我们的生活.当大数据开启一个时代时,拥有海量交易数据的阿里巴巴就已经认识到这是一座大的金矿,并在众多的电商企业中率先开始了淘金之旅,大数据平台也在其中扮演了非常重要的角色. 本视频是行在(奇点云创始人兼CEO)关于<从阿里巴巴大数据之路看企业中台战略>的分享.他以亲身经历讲述了阿里大数据的演变,大数据部门从组织架构到系统架构所

胖子哥的大数据之路(13):破题,或从数据整合开始

一.前言 这是关于互联网上一篇文章的读后感,原文标题<大数据成变量,BAT入口生态或生变局>.读这篇文章既有醍醐灌顶之顿悟,亦有如履薄冰之恐惧,阿里好强,动作好快.其实,最近一直在思考当代企业信息化架构EA框架的调整,基本的一个思路是数据上提,与业务架构平齐,不再只是作为业务系统的功能支撑,而是自成一片天地,独立运营.至于数据化运营与现有业务的关系,则可一分为二:其一.可进,进可开疆辟土,基于数据衍生新的业务形态:其二.可退,退而求其次,辅助优化现有业务,从简单粗暴,到整合 营销.变现空间,天

大数据之路week01--自学之集合_1

经过我个人的调查,发现,在今后的大数据道路上,集合.线程.网络编程变得尤为重要,为什么? 因为大数据大数据,我们必然要对数据进行处理,而这些数据往往是以集合形式存放,掌握对集合的操作非常重要. 在学习集合前,我们先看对象数组: 这是对象数组在创建到赋值到遍历的过程,其中我们遇到了一个数组的硬性问题:数组的大小是不可变的,而且数据类型也是不可变的,那么如果我们要插入一个新的元素该怎么办?很显然数组已经满足不了我们的需求. 此时我们将接触一个新的内容,集合. 集合 一.数组和集合的比较 数组不是面向

数据分析---大数据及机器学习

常用的库:Numpy.Pandas.Matplotlib.Scipy等: 编辑器:IPython和Jupyter notebook(Anaconda包含): 1.Numpy:Numerical Python缩写,主要用于数值计算. 2.Pandas:数据分析的主要工具. 3.matplotlib:绘制数据图表 4.scipy:科学计算领域针对不同标准问题的包的集合.强大的科学计算方法(矩阵分析.信号分析.数理分析等) 一.Numpy 安装方法:pip install numpy / conda

胖子哥的大数据之路(14):数据价值链模型

一.模型示意图 二.模型解读 Knowledge is also defined using taxonomy, with levels describing data, information, knowledge and wisdom. Briefly, data is defined as a fact. Information is a fact with some context. Knowledge is an understanding gained from a pattern