数据分析

相关职业:数据分析、数据科学、商业智能等

能力方面(soft skills)学习能力,理解能力,分析能力,沟通能力,最重要的一个能力:

将复杂的实际问题转化为数学模型,并利用计算机进行分析,预测和评估,再转化为合适的商业方案。

这是一个生态圈,不仅仅包括数学模型,统计理论,更不只是工具SAS、R、Excel。而是以实际问题为导向的,有这商业逻辑,和领域知识融合在理面的。

技术方面 包括你的数学,统计,编程,数据库,硬件等技术,最重要的:

为了解决商业问题所需要的技术,能力。

我觉得吧,能力方面方面是思维认识层面的,需要时间的积累,经验积累,而技术方面的能够在短时间内有所调高;

具体来说,技术包括以下几个层面:

1.  统计学,优化理论,机器学习,等理论

推荐书籍:数理统计教材(任何一本),优化理论(有数值分析的知识就够),机器学习(推荐看《统计学习方法》李航)

2. 借助计算机解决问题的能力:数据库查询(SQL),编程(Python,Java,R)

推荐先学Python,特别适合没有编程基础的入门编程,简单,易读,易调试;推荐在线教程:http://www.imooc.com/learn/177(Python入门)http://www.imooc.com/learn/317(Python进阶)

这个是imooc上的一套视频教程,可以在线练习,练习题附有答案,不必安装软件,视频免费,注册imooc的账号即可;如果懒得注册用我的也行?,

廖雪峰的个人网站 http://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000,Python在线中文教程,讲的挺好,适合入门;

建议用3天时间把“Python入门”的视频,配合廖的在线教程,消化掉,如果觉得还行,我觉得算是入门编程了,真的,相信我!

Java是现在国内用的较多语言,本身并不适合数据分析任务,但是数据类的产品要用到它,还有就是大数据的一些并行处理,会用到的,可以先不学它,Python学到一定程度了,再学;

R是一门统计语言,统计分析功能很强大,但是我不怎么会,很有必要,但一开始可以先不学它;

SQL数据库查询语言,常用的有开源的MySQL,必须会的,但是你可以先不接触,并不难,如果你以前学过 VISUAL FOXPRO(有二级考这个的,即VF),不会太陌生;

3. 大数据的工具,框架,编程模型,存储(Hadoop、Spark、MapReduce、Hive、Mongol DB等

客观的来说,这部分不是数据分析师(数据科学家)所必需的,是大数据工程师所必须的;可以先不看,如果有个时间表的话,一个月以后再了解这方面的;

时间: 2024-11-11 03:51:30

数据分析的相关文章

firefox查看微信公众平台的数据分析时就出现不信任链接怎么办?

昨天用360清理垃圾后火狐主页的快速拨号栏消失了,整了半天还是无法使用就重装了一下firefox,导入备份的书签,添加自己所需的附加组件,设置为隐私模式,开始继续体验.按惯例打开微信公众平台,查看数据分析时出现火狐不信任链接提示,如下图1,"我已充分了解可能的风险"这个链接按钮被挡住了,无法点击,怎么办? 这个应该是火狐安全站点检测的原因,到"工具-选项-安全-例外-添加信任站点",输入公众平台的主域名, 添加好之后,保存,重启firefox,打开微信公众平台查看数

python的数据分析的学习方法

python数据分析的要求并不是软件开发的要求,确实,对于一门工具,不同目的的使用者,需要的技能是不一样的,比如刀这个工具,屠夫用它是杀猪的,厨师用它是切菜的,军人用它是保家卫国的,客人用它是切牛排的,每个人用的方式都不一样,对于刀的掌握方法都有特定的要求. python数据分析,就如同学excel做数据分析一样,都是从了解python如何打开使用,如何在里面处理数据,如何筛选数据,如何统计分析,如何图表展示.python只是工具,关键还是处理问题的思维方法.我们学习python的目的不是为了写

数据分析之Numpy库入门

1.列表与数组 在python的基础语言部分,我们并没有介绍数组类型,但是像C.Java等语言都是有数组类型的,那python中的列表和数组有何区别呢? 一维数据:都表示一组数据的有序结构 区别: 列表:数据类型可以不同,如:[3.1413,'pi',3.1404,[3.1402,2.34],'3.2376'] 数组:数据类型相同 .如[3.14,34.34,3433.3,343.23] 二维数据:二维数据由多个一维数据构成,是一维数据的集合形式!表格是典型的二维数据! 注意:表格的表头,可以是

【Python数据分析】用户通话行为分析

主要工作: 1.对从网上营业厅拿到的用户数据.xls文件,通过Python的xlrd进行解析,计算用户的主叫被叫次数,通话时间,通话时段. 2.使用matplotlib画图包,将分析的结果直观的绘制出来. 具体步骤: 1.分析须要的内容 excel文件中包含很多信息,我们分析的时候须要用到的包括,通话起始时间.通话时长.呼叫类型,号码. 使用xlrd模块,读取excel中的数据,用列表的形式保存下来. 1 #coding=utf-8 2 import xlrd 3 4 def readData(

利用python进行数据分析--(阅读笔记一)

以此记录阅读和学习<利用Python进行数据分析>这本书中的觉得重要的点! 第一章:准备工作 1.一组新闻文章可以被处理为一张词频表,这张词频表可以用于情感分析. 2.大多数软件是由两部分代码组成:少量需要占用大部分执行时间的代码,以及大量不经常执行的“粘合剂代码”. cython已经成为python领域中创建编译型扩展以及对接c/c++代码的一大途径. 3.在那些要求延迟性非常小的应用程序中(例如高频交易系统),为了尽最大可能地优化性能,耗费时间使用诸如C++这样更低级.更低生产率的语言进行

《Python数据分析常用手册》一、NumPy和Pandas篇

一.常用链接: 1.Python官网:https://www.python.org/ 2.各种库的whl离线安装包:http://www.lfd.uci.edu/~gohlke/pythonlibs/#scikit-learn 3.数据分析常用库的离线安装包(pip+wheels)(百度云):http://pan.baidu.com/s/1dEMXbfN 密码:bbs2 二.常用库 1.NumPy NumPy是高性能科学计算和数据分析的基础包.部分功能如下: ndarray, 具有矢量算术运算和

物联网将对大数据分析产生哪些影响?

数据一直在业务中发挥关键作用,但大数据分析的兴起,大量存储的信息可以在计算上挖掘出来,揭示有价值的见解.模式和趋势,使其在现代商业领域几乎不可或缺.收集和分析这些数据并将其转化为可行的结果的能力是成功的关键. 随着物联网的发展,这一过程变得越来越复杂,在日常生活中,从车辆到商店展示,到智能家居自动化技术,如恒温器和水位显示器,都能产生大量的数据.物联网带来了各种新的分析挑战,而更快适应这一新现实的企业将获得明显的优势. 改变基础设施的需求 物联网产生的数据面临的主要问题之一就是它的规模.英特尔公

基于Hadoop离线大数据分析平台项目实战

基于Hadoop离线大数据分析平台项目实战  课程学习入口:http://www.xuetuwuyou.com/course/184 课程出自学途无忧网:http://www.xuetuwuyou.com 课程简介: 某购物电商网站数据分析平台,分为收集数据.数据分析和数据展示三大层面.其中数据分析主要依据大数据Hadoop生态系统常用组件进行处理,此项目真实的展现了大数据在企业中实际应用. 课程内容 (1)文件收集框架 Flume ①Flume 设计架构.原理(三大组件) ②Flume 初步使

Power BI教程_Power BI数据分析快速上手及案例实战

Power BI数据分析快速上手及案例实战 课程学习地址:http://www.xuetuwuyou.com/course/194 课程出自学途无忧网:http://www.xuetuwuyou.com 课程简介 本课程在<Power BI 数据分析快速上手>基础上结合大量的实例,深入讲解PowerBI中看似难懂的各种概念.操作, 并结合行业中的典型案例贯穿了从初级的数据透视表工具.数据透视表选项.数据透视表的刷新.数据透视表中的排序,到中级的动 态数据透视表的创建.数据透视表函数 GETPI

Web前台直接加载GIS格式数据分析

本文以Flex直接加载Shp.DWG和MDB为例. 首先看一份现估测数据: 1)  加载Shp文件,目前直接由前台Flex代码完成: 图1 在ArcCatalog里面的Shp文件 图2 直接在前台加载后的Shp文件 结果显示: Shp文件 大小 加载时间 Shp1 50kb 约3s Shp2 750kb 约10s 分析:未用后台开发,直接使用前台Flex对SHP开放数据加载,省去通讯时间,速度快捷,速度与客户端配置成正比. 说明:直接加载使用了LibertyGIS.swc组件. 2)  加载Dw