优达学城数据分析师纳米学位——第一课总结

从1月13号信誓旦旦的付款了第一位的纳米学位到今天已经一周多的时间了,可以发现自己在完成任务的时候更多的在乎的是不是时间上达到了要求,而没有过多的关注于实质的内容。有时候看到课程的小节数很多就有一种畏惧感和烦躁的心情,逐渐的说服自己取放弃,这其实是一种观念上的偏差。可能是因为自己的性格比较急躁,很多事情都想要迅速的完成并且还能够保证质量,但是实际来说,只要方法得当,最后的成果总会和你投入的时间成正比,放平心态,一步一步慢慢来。

下面对第一课所学的内容做一个梳理和总结。

研究方法 数据可视化 集中趋势 可变性 归一化 正态分布 抽样分布 估计 假设检验 t检验

BBC测量记忆力的实验: 定义抽象概念,将一个抽象概念转化成为一个具有实际操作性,可测性的变量

样本与全体的不同,样本能够估计整体统计值,但是样本一定会带有一定的误差,需要进行相关的分析和处理,样本偏差,抽样分布的结果可以确定某一样本在整体中所占的位置,z值和t值来表示某一个特定值与平均值的差异

例子:安慰剂实验检测 单盲与双盲的实验不同

金色拱门理论:Mcdonald 开M的两个国家都没有参战,关性不代表因果关系

数据可视化:

原始的数据集合 

经过初步整理的数据集合

例子:对Udacity学生的来源进行统计分析,

组距,频率,相对频率,百分比,占比,数值型的数据or类别性的数据,正偏斜分布(频率低的值在X轴正方向)

3.集中趋势:

众数,中位数,平均值

4.差异值:

极差,偏差,平均偏差和,标准差,方差,4分之1值,样本标准差(贝塞尔校正)

5.归一化:

利用相对频率引出概率密度函数正态分布的概念

例子:Andy的Facebook  katie的Twitter 归一化是为了比较不同参考体系下的两个个体 转换为z值进行相关比较

6.正态分布:

7.抽样分布:

例子:四面体骰子,投掷两次,

t分布 如何引出t分布分概念,是否能够将σ做为已知量带入计算,t分布根据自由度的不同进行区分,自由度越大的t分布越接近于正态分布

时间: 2024-12-24 21:25:18

优达学城数据分析师纳米学位——第一课总结的相关文章

优达学城数据分析师纳米学位——第二课 jupyter notebook的使用

shift+Enter Control+Enter shift+tab 查看代码功能 tab显示相关包中的命令名称 ESC转换为命令操作 s 保存快捷键 命令行 小键盘图片 保存类型 Markdown html python文件 Markdown 单元格 使得代码更加易读  LaTeX free software可以编辑数学公式和符号 '配置Jupyter notebook' 6/11-markdown 单元格

优达学城数据分析师纳米学位——P3项目知识点整理及代码分析

P3 OpenStreetMap 项目思路整理 P3项目的核心在于数据的整理 data cleaning 数据清洗,数据来源于开源的OpenStreetMap平台,该平台上的很多数据都是开发者自行输入的,难免会造成数据的混乱和缺失,错误,也就是所说的dirty data 脏数据 human involved data cleaning的关注点 validity completeness accuracy consistency uniformity validity 有效性 数据是否符合常理 人

优达学城机器学习工程师纳米学位项目介绍

本文由 meelo 原创,请务必以链接形式注明 本文地址,简书同步更新地址 一对一的项目辅导是优达学城(udacity)纳米学位的一大亮点.本文将简要介绍优达学城机器学习工程师纳米学位的6个项目.项目覆盖了机器学习的主要领域,包括回归分析.分类.聚类.增强学习及深度学习. 项目 0: 预测泰坦尼克号乘客生还率 这个项目需要你手动地实现一个简单的机器学习模型——决策树.1912年泰坦尼克号在第一次航行中与冰山碰撞沉没,泰坦尼克号乘客生还数据集记录了之中891个乘客的性别.年龄.社会阶级.配偶数量等

优达学城自动驾驶课程项目——车道检测

汽车在道路上行驶需要遵循一定的行驶规则,路面的车道则起到规范汽车行驶规则的作用.车道的种类有很多种,如单行线.双行线,虚线.网格线等,不同颜色.形状的车道线代表着不同的行驶规则,汽车和行人可以根据这些规则来使用道路,避免冲突.因此,准确检测并识别车道类型,并按照相应规则正确行驶,是汽车实现自动驾驶的基础. 优达学城的自动驾驶项目课程包含了一个车道线检测项目,其主要目的就是教给无人车如何检测并识别车道,本文档将该项目内容进行总结整理. 车道线检测方法主要分为两类:(1)基于道路特征的车道线检测:(

Udacity(优达学城) 300块红包优惠券

纳米学位:来自硅谷的名企官方课程 7天免费试用结束后,在"我的教室->设置->纳米学位->续费"页面上的优惠码区域,输入AF55BA53,立即减300元:

优达学城-并行编程-Unit2 通信模块、同步机制、原子操作

(一). Parallel communication Patterns 在上一章CUDA系列学习(二)CUDA memory & variables中我们介绍了memory和variable的不同类型,本章中根据不同的memory映射方式,我们将task分为以下几种类型:Map, Gather, Scatter, Stencil, transpose. 1.1 Map, Gather, Scatter Map: one input - one output Gather: several in

优达学城-并行编程-Unit2 硬件内存

GPU负责给SM分配wrap,SM以并行方式运行程序 在一个SM上跑的所有线程可能合作解决一个子问题(错的,不一定的) 一个单Kernel程序在多个wrap上运行,包含X线程块和Y线程块,可以确定x y先后跑的顺序或是在哪个SM上跑吗? 答:伐晓得(这是cuda的小秘密= =||) GPU的优越性: 1.快速切换SM运行,无法知其间通信 2.可扩展性强,GPU越大,任务分散越广 CUDA存储器类型: 每个线程拥有自己的register and loacal memory; 每个线程块拥有一块sh

大数据开发Hadoop工程师-第一课 Java基本知识和JDK的安装配置

Java概述 Java的版本 Java为消费类智能电子产品而设计,但智能家电产品并没有像最初想象的那样拥有大的发展.跨平台是Java语言的核心优势,赶上最初互联网的发展,并随着互联网的发展而发展,建立了强大的生态体系,目前已经覆盖IT各行业的"第一大语言",是计算机界的"英语". JavaSE(J2SE)(Java2 Platform Standard Edition)(Java平台标准版) 标准版,定位在个人计算机上的应用.这个版本是Java平台的核心,主要用于桌

数据分析师之Excel数据处理与分析实战

Excel数据处理与分析实战 课程学习地址:http://www.xuetuwuyou.com/course/191 课程出自学途无忧网:http://www.xuetuwuyou.com 课程简介 本门课程详细介绍了 Microsoft Excel 的应用知识,Excel也称为电子表格,是Microsoft office 套装软件的一个重要组成部分.利用它可以进行各种数据的混合运算外,还可以应用于财务会计.统计分析.证券管理.决策管理以及市场营销等众多领域.正因为它具有如此广泛的应用,所以才得