优达学城数据分析师纳米学位——第一课总结

从1月13号信誓旦旦的付款了第一位的纳米学位到今天已经一周多的时间了，可以发现自己在完成任务的时候更多的在乎的是不是时间上达到了要求，而没有过多的关注于实质的内容。有时候看到课程的小节数很多就有一种畏惧感和烦躁的心情，逐渐的说服自己取放弃，这其实是一种观念上的偏差。可能是因为自己的性格比较急躁，很多事情都想要迅速的完成并且还能够保证质量，但是实际来说，只要方法得当，最后的成果总会和你投入的时间成正比，放平心态，一步一步慢慢来。

下面对第一课所学的内容做一个梳理和总结。

研究方法数据可视化集中趋势可变性归一化正态分布抽样分布估计假设检验 t检验

BBC测量记忆力的实验：定义抽象概念，将一个抽象概念转化成为一个具有实际操作性，可测性的变量

样本与全体的不同，样本能够估计整体统计值，但是样本一定会带有一定的误差，需要进行相关的分析和处理，样本偏差，抽样分布的结果可以确定某一样本在整体中所占的位置，z值和t值来表示某一个特定值与平均值的差异

例子：安慰剂实验检测单盲与双盲的实验不同

金色拱门理论：Mcdonald 开M的两个国家都没有参战，关性不代表因果关系

数据可视化：

原始的数据集合

经过初步整理的数据集合

例子：对Udacity学生的来源进行统计分析，

组距，频率，相对频率，百分比，占比，数值型的数据or类别性的数据，正偏斜分布（频率低的值在X轴正方向）

3.集中趋势：

众数，中位数，平均值

4.差异值：

极差，偏差，平均偏差和，标准差，方差，4分之1值，样本标准差（贝塞尔校正）

5.归一化：

利用相对频率引出概率密度函数正态分布的概念

例子：Andy的Facebook katie的Twitter 归一化是为了比较不同参考体系下的两个个体转换为z值进行相关比较

6.正态分布：

7.抽样分布：

例子：四面体骰子，投掷两次，

t分布如何引出t分布分概念，是否能够将σ做为已知量带入计算，t分布根据自由度的不同进行区分，自由度越大的t分布越接近于正态分布

时间： 2024-12-24 21:25:18

优达学城数据分析师纳米学位——第一课总结的相关文章

优达学城数据分析师纳米学位——第二课 jupyter notebook的使用

shift+Enter Control+Enter shift+tab 查看代码功能 tab显示相关包中的命令名称 ESC转换为命令操作 s 保存快捷键命令行小键盘图片保存类型 Markdown html python文件 Markdown 单元格使得代码更加易读 LaTeX free software可以编辑数学公式和符号 '配置Jupyter notebook' 6/11-markdown 单元格

优达学城数据分析师纳米学位——P3项目知识点整理及代码分析

P3 OpenStreetMap 项目思路整理 P3项目的核心在于数据的整理 data cleaning 数据清洗,数据来源于开源的OpenStreetMap平台,该平台上的很多数据都是开发者自行输入的,难免会造成数据的混乱和缺失,错误,也就是所说的dirty data 脏数据 human involved data cleaning的关注点 validity completeness accuracy consistency uniformity validity 有效性数据是否符合常理人

优达学城机器学习工程师纳米学位项目介绍

本文由 meelo 原创,请务必以链接形式注明本文地址,简书同步更新地址一对一的项目辅导是优达学城(udacity)纳米学位的一大亮点.本文将简要介绍优达学城机器学习工程师纳米学位的6个项目.项目覆盖了机器学习的主要领域,包括回归分析.分类.聚类.增强学习及深度学习. 项目 0: 预测泰坦尼克号乘客生还率这个项目需要你手动地实现一个简单的机器学习模型——决策树.1912年泰坦尼克号在第一次航行中与冰山碰撞沉没,泰坦尼克号乘客生还数据集记录了之中891个乘客的性别.年龄.社会阶级.配偶数量等

优达学城自动驾驶课程项目——车道检测

汽车在道路上行驶需要遵循一定的行驶规则,路面的车道则起到规范汽车行驶规则的作用.车道的种类有很多种,如单行线.双行线,虚线.网格线等,不同颜色.形状的车道线代表着不同的行驶规则,汽车和行人可以根据这些规则来使用道路,避免冲突.因此,准确检测并识别车道类型,并按照相应规则正确行驶,是汽车实现自动驾驶的基础. 优达学城的自动驾驶项目课程包含了一个车道线检测项目,其主要目的就是教给无人车如何检测并识别车道,本文档将该项目内容进行总结整理. 车道线检测方法主要分为两类:(1)基于道路特征的车道线检测:(

Udacity(优达学城) 300块红包优惠券

纳米学位:来自硅谷的名企官方课程 7天免费试用结束后,在"我的教室->设置->纳米学位->续费"页面上的优惠码区域,输入AF55BA53,立即减300元:

优达学城-并行编程-Unit2 通信模块、同步机制、原子操作

(一). Parallel communication Patterns 在上一章CUDA系列学习(二)CUDA memory & variables中我们介绍了memory和variable的不同类型,本章中根据不同的memory映射方式,我们将task分为以下几种类型:Map, Gather, Scatter, Stencil, transpose. 1.1 Map, Gather, Scatter Map: one input - one output Gather: several in

优达学城-并行编程-Unit2 硬件内存

GPU负责给SM分配wrap,SM以并行方式运行程序在一个SM上跑的所有线程可能合作解决一个子问题(错的,不一定的) 一个单Kernel程序在多个wrap上运行,包含X线程块和Y线程块,可以确定x y先后跑的顺序或是在哪个SM上跑吗? 答:伐晓得(这是cuda的小秘密= =||) GPU的优越性: 1.快速切换SM运行,无法知其间通信 2.可扩展性强,GPU越大,任务分散越广 CUDA存储器类型: 每个线程拥有自己的register and loacal memory; 每个线程块拥有一块sh

大数据开发Hadoop工程师-第一课 Java基本知识和JDK的安装配置

Java概述 Java的版本 Java为消费类智能电子产品而设计,但智能家电产品并没有像最初想象的那样拥有大的发展.跨平台是Java语言的核心优势,赶上最初互联网的发展,并随着互联网的发展而发展,建立了强大的生态体系,目前已经覆盖IT各行业的"第一大语言",是计算机界的"英语". JavaSE(J2SE)(Java2 Platform Standard Edition)(Java平台标准版) 标准版,定位在个人计算机上的应用.这个版本是Java平台的核心,主要用于桌

数据分析师之Excel数据处理与分析实战

Excel数据处理与分析实战课程学习地址:http://www.xuetuwuyou.com/course/191 课程出自学途无忧网:http://www.xuetuwuyou.com 课程简介本门课程详细介绍了 Microsoft Excel 的应用知识,Excel也称为电子表格,是Microsoft office 套装软件的一个重要组成部分.利用它可以进行各种数据的混合运算外,还可以应用于财务会计.统计分析.证券管理.决策管理以及市场营销等众多领域.正因为它具有如此广泛的应用,所以才得

猜你喜欢

leetcode 27 Remove Element

Given an array and a value, remove all instances of that value in place and return the new length. T ...

Error:Could not find com.android.tools.build:gradle:2.14.1.

你只要一步把Android Plugin Version改为最新的:2.2.0-beta3(这是目前最新的).直接在Project Structru->Project->Android P ...

hdu 2838 Cow Sorting 树状数组

hdu2838 ------希望30号驾校科目一顺利考完,4月即将过去说好的30篇博客也没完成, 真是忙起来就会烦躁什么都不想做,勿忘心安.... <Cow Sorting> 这题本来兴高 ...

working with fitnesse wiki pages

fitnesse提供一个简单易用的wiki创建一个web页面用于测试.测试页面有一个button,允许所有的测试在这个页面运行,因此任何人在任何时间都可以去这个页面点击这个按钮,查看测试是否通过.fi ...

Raspberry Pi AP功能改进: systemd服务封装以及dnsmasq的使用

前言在上一篇<Raspberry pi 设置自动拨号, 搭建无线路由环境>一文中,笔者利用hostapd和udhcpd程序,创建无线热点,实现地址分配以及DNS服务器的设置.本篇将基于上一 ...

CentOS 安装 Jexus

官网:http://www.jexus.org/ 安装过程就照着页面上做就好了,前提是需要安装好mono 在VS2015中新建一个MVC应用程序,这里需要注意两个步骤: 第1步:移除bin下的Micr ...

UILable根据文字内容，自适应高度

//UILabel自适应文本的高度 UILabel *label = [[UILabel alloc]initWithFrame:CGRectMake(0, 100, 300, 100)]; labe ...

Android实现图片裁切

介绍在应用开发中,如果涉及到个人信息,头像一般是不可避免的,类似这种情况,我们就需要用到图片裁切的功能,实现头像裁切,然后上传给服务器. 一般裁切的做法就是图层叠加选取框,然后根据坐标,计算裁切区域 ...

【转】NHIBERNATE的各种保存方式的区别 (SAVE,PERSIST,UPDATE,SAVEORUPDTE,MERGE,FLUSH,LOCK)

前言今天学学习NH这个框架,在新增对象的时候,看见大神用了persist而没有用Save,心中比较疑惑,查阅资料的时候,发现这篇写的非常不错,转载供大家参考. hibernate的保存hiberna ...

uva 10375

1 /* 选择与除法_________________________________________________________________________________ 2 3 #inc ...

Kill XXX.py by python and psutil

项目背景: 生产环境中需要部署几百台我写的一个采集监控程序,但近期需求改动较多,需要每隔一段时间就更新一个版本,人工更新太费事,所以我又写了一个跨平台的基于Python的自动更新程序,通过自定义更新策 ...

带病投保，如何才不会被拒绝？

我有某种疾病,买保险怎样不会被拒保? 深蓝保微信号 shenlanbao 功能介绍不卖保险,仅仅解决这个问题,为你推荐性价比最高的保险产品. 过去我们服务的客户中,有一小部分用户是有过往疾病的,眼 ...

[NOIP2014]联合权值题解

题目大意: 有一棵树,求距离为2的点权的乘积的和以及最大值. 思路: 枚举每一个点,则与其相邻的点互为距离为2的点.该部分的最大值为点权最大的两个点的积,和为点的权值和的平方减去每个点的平方,这样每条 ...

JAVA 编码中文简述

中文编码问题虽然是个老问题,但对不熟悉的人来说还是不好处理的.不过Java中已经有了一套比较成熟的解决方案. 首先对中文编码格式予以简单介绍:中文编码有三套国标:GB2312,GBK,GB18030, ...

[转]Mac 科研常用软件

转自:http://bbs.feng.com/read-htm-tid-7698336.html 我的 Mac 是 2012 年的 Pro Retina,现在主要用的是 Mac 系统,Windows ...

图片的缓存

高效加载大图片我们在编写Android程序的时候经常要用到许多图片,不同图片总是会有不同的形状.不同的大小,但在大多数情况下,这些图片都会大于我们程序所需要的大小.比如说系统图片库里展示的图片大都是 ...

两阶段提交与三阶段提交【分布式数据一致性】

1.任何一个技术,都是为了解决某个问题,有它的使用场景. 2.考虑下面的应用场景:一个指挥官,A,B,C,D四个将军分布在四个方向,指挥官制定明天攻城的计划.如何保证四个将军同时执行攻城的命令? 第一 ...

java多线程很好的一个实例

java中的多线程在java中要想实现多线程有两种手段一种是继续Thread类另外一种是实现Runable接口. 对于直接继承Thread的类来说代码大致框架是 ? 1 2 3 4 5 6 ...

今夜，与你垂钓柔醉月光

今夜,与你垂钓柔醉月光今夜,月圆,若有风儿轻叩窗轩,那是月光对秋的唇语呢喃,莺啼燕婉,诉不尽眷恋万千.月下聆听,半卷心念,让心如月般的隽美,轻依一弯露染缠绵的思念.遥望,月满,不去惊扰你梦里一丝香甜, ...

CentOS 7 通过持续集成包安装最新的 Mono

Mono 3.6.0 发布,此版本从上一个版本开始,总共提交了 878 个commits.自2014 年 3 月 10 日开始,共有66 位贡献者参与开发: 其中有22位首次提交的贡献值,他们修复了 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.022 s.