第一章、数据分析介绍

目录

  • 一、数据分析介绍

    • 1、数据分析是什么
    • 2、数据分析能干什么
    • 3、为什么利用Python进行数据分析
    • 4、数据分析过程概述
    • 5、常用库简介

一、数据分析介绍

  • 数据分析是什么?
  • 数据分析能干什么?
  • 为什么利用Python进行数据分析?
  • 数据分析过程概述
  • 常用库简介

1、数据分析是什么

在我们如今这个时代,相信大多数人都能明白数据的重要性,数据就是信息,而数据分析就是可以让我们发挥这些信息功能的重要手段。

2、数据分析能干什么

对于数据分析能干什么其实我们可以简单的举几个例子:

1、淘宝可以观察用户的购买记录、搜索记录以及人们在社交媒体上发布的内容选择商品推荐

2、股票可以根据相应的数据选择买进卖出

3、今日头条可以将数据分析应用到新闻推送排行算法当中

4、爱奇艺可以为用户提供个性化电影推荐服务

其实数据分析不仅可以完成像以上这样的推荐系统,在制药行业也可运用数据分析来预测什么样的化合物更有可能制成高效药物等

所以说数据分析绝对是未来所有公司不可或缺的岗位,目前社会上获取数据方式太多了,这么多的数据,只要我们拥有数据分析的技能,绝对可以应付任何岗位上的工作。

3、为什么利用Python进行数据分析

  • 1、Python的代码语法简单易学
  • 2、Python可以很容易的整合C、C++等语言的代码
  • 3、Python有大量用于科学计算的库
  • 4、Python不仅可以用于研究和原型构建,同时也适用于构建生产系统

4、数据分析过程概述

4.1、提出问题

在真正的工作场景下,往往我们需要的处理的是多个庞大的数据集还有可能是类型完全不同的数据,那这个时候一个准确的问题就可以让我们聚集与问题相关的那部分数据,为后续的分析操作提供一个明确的方向,帮助我们得到一个有意义的结论。

4.2、整理数据

整理数据主要分为三步:

(1)、收集数据

通过多种途径拿到数据,导入到Jupyter Notebook

(2)、评估数据

这一步主要是需要找出数据是否存在质量或者结构等方面的问题

(3)、清理数据

通过修改、替换、删除等方式保证数据质量高、结构好

3.3、探索性数据分析

在这一步骤主要可以探索并且扩充数据

4.4、得出结论

在进行完探索性数据分析之后肯定会得出一个结果或者说是结论,这样我们就可以根据这样一个结论进行相应的操作,就比如说分析股票数据得到那个大盘趋势好可以选择买进,又或者说类似于万达这样的大型商场可以分析那种类型的商品会比较受用户的欢迎,以便针对性的存货。但是具体的操作可能就需要用到机器学习或者推断统计学来实现,这个就与数据分析不一样了

4.5、传达结果

分析的能力有多强,分析的价值就有多大。

这一步主要是向其他人证明你发现的见解以及传达意义

5、常用库简介

Numpy

Numpy是Numerical Python的简写,主要可以用来做Python数值计算。它提供了多种数据结构、算法以及大部分涉及Python数值计算所需的接口。

  • 快速、高效的多维数组对象ndarray
  • 基于元素的数组计算以及直接对数组执行数学运算的函数
  • 用于读写硬盘上基于数组的数据集的工具
  • 线性代数运算、傅里叶变换,以及随机数生成
  • 用于将C、C++、Fortran代码集成到python的工具

Pandas

Pandas使我们进行数据分析的一个主要工具。它所包含的数据结构和数据处理工具的设计使得Python中进行数据清洗和分析非常快捷。pandas一般也是和其他数值计算工具一起使用的,支持大部分Numpy语言风格的数组计算。pandas和numpy最大的区别就是pandas是用来处理表格型或者异质性数据的,而Numpy则刚好相反,它更适合处理同质型的数值类数组数据

matplotlib

matplotlib是最流行的用于绘制数据图表的python库。

Scipy

Scipy是科学计算领域针对不同标准问题域的包集合。提供了强大的科学计算方法(矩阵分析、信号分析、数理分析等)

IPython和Juypyter notebook

IPython是一个加强版的Python解释器,Juypyter notebook是一种基于Web的代码笔记本,最初也是源于IPython项目。

原文地址:https://www.cnblogs.com/demiao/p/12196911.html

时间: 2024-07-29 23:54:56

第一章、数据分析介绍的相关文章

The Book of CSS3 中文版 第一章:介绍CSS3

在这一章,为了展示本书所用的代码约定我会介绍一些新的CSS3属性,但在此之前我想简要说明下CSS3的历史.很想然你不需要为了使用CSS3去了解它的历史,但是我认为有一些关于CSS3当前状态的背景是很重要的. CSS3是一个在变化的规范.规范的一部分被认为是稳定的并且在现代浏览器中得到了很好的实现:规范的另一部分应当作实验性的并且被部分地不同程度的实现:还有一部分则仍然是理论上的提议,并且没有得到任何实现.一些浏览器创建了它们自己的CSS属性,这些属性不属于任何CSS3规范也许将来也不会添加进去.

LTP 第一章 LTP介绍及内部机制

https://blog.csdn.net/yuanlaijike/article/details/78068331 LTP 第一章 LTP介绍及内部机制原创Jitwxs 发布于2017-09-23 03:21:58 阅读数 3993 收藏展开LTP系列链接: 第一章 LTP介绍及内部机制 第二章 开发Shell测试集 第三章 开发系统调用测试集 第四章 开发_exit()测试集 第五章 开发IO操作测试集 第六章 开发IO阻塞测试集 文章目录1.1 LTP介绍1.1.1 功能测试1.1.2 回

Delphi基本之pascal语法(第一章.pascal介绍)

第一章.pascal介绍一.pascal的基本语法单位 1.基本符号 A——Z:a——z:0——9:+,-,*,/,=,<>,<=,>=,<,>,(,),[,],{,},:=,,,:,.,:,..,',^ 注意:pascal语言除了能使用以上规定的基本符号外,不得使用任何其它符号. 2.保留字 AND,ARRAY,BEGIN,CASE,CONST,DIV,DO,DIWNTO,ELSE,END,FILE,FOR,FUNTION,GOTO,IF,LABEL,MOD,NIL,

Windows PowerShell 学习---第一章 PowerShell介绍

第1章 PowerShell介绍 1.1.什么是PowerShell 2006年,微软发布一款叫做Windows PowerShell的全新脚本语言. PowerShell与命令提示符shell一样,PowerShell可以进行交互性地输入命令.也可以很容易的使用管道和重定向将文件和程序串联起来. 不过,PowerShell确是一个强大的面向对象的语言,可以用于复杂的脚本编程. 1.2.面向对象的命令shell 关于cmd 如果在命令提示符下输入dir,dir命令将会在屏幕打印出目录中的文件名.

Java 螺纹第三版 第一章Thread介绍、 第二章Thread创建和管理学习笔记

第一章 Thread导论 为何要用Thread ? 非堵塞I/O I/O多路技术 轮询(polling) 信号 警告(Alarm)和定时器(Timer) 独立的任务(Task) 并行算法 第二章 Thread的创建与管理 一.什么是Thread ? Thread是所在主机运行的应用程序任务(task). 仅仅有一个线程的样例: public class Factorial { public static void main(String[] args) { int n = 5; System.o

《Getting Started with WebRTC》第一章 WebRTC介绍

? 本章是对WebRTC做概念性的介绍. 阅读完本章后.你将对下面方面有一个清晰的理解: .  什么是WebRTC .  怎样使用它 .  哪些浏览器支持 1.1. WebRTC介绍 World Wide Web(WWW)是出如今1990年代的早期, 它是建立在使用HREF超链接的以页面为中心的模型上. 在这个网页的早期模型中,浏览器从一个网页到还有一个网页是通过更新HTML内容来实现的. 到了2000年,一种新的网页浏览方式开发出来了, 且在后面变成了一个标准.即 XMLHttpRequest

HTML+CSS基础 第一章 html介绍

1-1 代码初体验,制作我的第一个网页 欢迎来到HTML+CSS课堂,加入高端大气上档次的web前端开发团队.我们在正式学习之前,先来热热身,问候下世界,做个人生中的第一个html网页吧. 任务 请在右边编辑器的第8行,在<h1>和</h1>标签之间,输入Hello World 字符串. 1 <!DOCTYPE HTML> 2 <html> 3 <head> 4 <meta http-equiv="Content-Type&quo

《Spring敲门砖之基础教程第一季》 第一章 概要介绍

百度百科say: Spring是一个开源框架,Spring是于2003 年兴起的一个轻量级的Java 开发框架,由Rod Johnson创建.简单来说,Spring是一个分层的JavaSE/EEfull-stack(一站式) 轻量级开源框架.点击查看 WiKi say: Spring Framework 是一个开源的Java/Java EE全功能栈(full-stack)的应用程序框架,以Apache许可证形式发布,也有.NET平台上的移植版本.该框架基于 Expert One-on-One J

第一章&#183;MySQL介绍及安装

一.DBA工作内容及课程体系 二.MySQL课程体系介绍 三.DBA的职业素养 四.MySQL简介及安装 01 什么是数据? 02 什么是数据库管理系统 03 数据库管理系统种类 04 MySQL发展史 05 MySQL正在推动世界 06 MySQL简介及产品线 06 MySQL 安装 一.DBA工作内容及课程体系 二.MySQL课程体系介绍 三.DBA的职业素养 四.MySQL简介及安装 01 什么是数据? 数据(data)是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加

第一章:介绍

这一章故意写的很简短,以便于你(读者)能够更快地从真正的内容(从第2章)开始.想要看书中的导航目录,你可以点击左上角的菜单按钮,并单击章节.节.图等的链接. 在下一节中,我们将介绍本书的基本符号,这将不会在后面再次说明.因为本书主要集中于线性代数,所以,只介绍特定于线性代数的相关符号,如:向量.点.矩阵等.最后,这一章将会用三角学(1.2节)的概述来结尾,在开始阅读本书的剩余部分之前,我们最好先回顾一下. 1.1 简记符号 1.2 三角学 翻译自http://immersivemath.com/