高等数理统计(四)

引言

  【比较官方的简介】数理统计学是一门以概率论为基础,应用性很强的学科。它研究怎样以有效的方式收集、 整理和分析带有随机性的数据,以便对所考察的问题作出正确的推断和预测,为采取正确的决策和行动提供依据和建议。数理统计不同于一般的资料统计,它更侧重于应用随机现象本身的规律性进行资料的收集、整理和分析。

  【简单的讲】,就是通过样本分析来推断整体。

  【意义或者重要性】在这个大数据时代,数据是非常重要的。怎样挖掘数据内部的规律或者隐含的信息,变得尤为重要。当时我们是不可能获得整体的数据的,所以我们只能通过抽取样本,进而通过样本来推断整体的规律。

  【目录】

  第一章、样本与统计量

    一、引言:

    二、总体与样本:

    三、统计量:

    四、常用分布:

  第二章、参数估计

    一、引言:

    二、点估计——矩估计法

    三、点估计——极大似然估计

    四、估计量的优良性准则

    五、区间估计——正态分布

      1、引入

      2、单个正态总体参数的区间估计

      3、两个正态总体的区间估计

    六、区间估计——非正态分布:

      1、大样本正态近似法

      2、二项分布

      3、泊松分布

  第三章、假设检验

    一、引言:

    二、正态总体均值的假设检验

      1、单正态总体 N(μ, σ2)均值 μ 的检验

        (1) 双边检验 H0: μ = μ0;H1: μ≠μ0 

        (2) 单边检验 H0: μ = μ0;H1: μ>μ0

      2、两个正态总体 N(μ1, σ12) 和  N(μ2, σ22)均值的比较

        (1) 双边检验 H0μ1 = μ2;H1μ1μ2 

         (2) 单边检验 H0μ1 >= μ2;H1μ1<μ2 

        (3) 单边检验 H0μ1 <= μ2;H1μ1>μ2 

    三、正态总体方差的检验

      1、单个正态总体方差的 χ2 检验

        (1) H0: σ2 =σ02;H1: σ2 ≠σ02

        (2) H0: σ2 =σ02;H1: σ2 >σ02

        (3)  H0σ2 ≤σ02;H1σ2 > σ02 (同2.)

      2、两正态总体方差比的 F 检验

         (1).  H0: σ12 = σ22;H1: σ12 ≠  σ22.

         (2) H0: σ12 = σ22;H1:    σ12> σ22

         (3) H0: σ12 ≤ σ22;H1:    σ12> σ22

  第四章、回归分析

    一、引言

第四章、回归分析

  一、引言:

  变量间的两类关系:十九世纪,英国生物学家兼统计学家高尔顿研究发现:

其中x表示父亲身高, y 表示成年儿子的身高(单位:英寸,1英寸=2.54厘米)。这表明子代的平均高度有向中心回归的意思,使得一段时间内人的身高相对稳定。之后回归分析的思想渗透到了数理统计的其它分支中。

   Ø 回归分析处理的是变量与变量间的关系。变量间常见的关系有两类:确定性关系与相关关系

    Ø 变量间的相关关系不能用完全确切的函数形式表示,但在平均意义下有一定的定量关系表达式,寻找这种定量关系表达式就是回归分析的主要任务。

  Ø 回归分析便是研究变量间相关关系的一门学科。它通过对客观事物中变量的大量观察或试验获得的数据,去寻找隐藏在数据背后的相关关系,给出它们的表达形式——回归函数的估计

  

  二、一元线性回归

  1、一元线性回归模型

  设y与x间有相关关系,称x为自变量(预报变量),y为因变量(响应变量),在知道x取值后,y有一个分布p(y|x),我们关心的是y的均值E(Y|x)

    

  这便是y关于x的理论回归函数——条件期望,也就是我们要寻找的相关关系的表达式。通常,相关关系可用下式表示:y =f (x)+ ε,其中ε是随机误差,一般假设ε ~N(0,σ2)

  进行回归分析首先是回归函数形式的选择。当只有一个自变量时,通常可采用画散点图 的方法进行选择。

  【例1】合金的强度y (×107Pa) 与合金中碳的含量x (%) 有关。为研究两个变量间的关系。首先是收集数据,我们把收集到的数据记为(xi,yi) ,i=1,2, ... , n。本例中,我们收集到12组数据,列于表1中

    

  为找出两个量间存在的回归函数的形式,可以画一张图:把每一对数(xi,yi)看成直角坐标系中的一个点,在图上画出n个点,称这张图为散点图,见图1

    

  从散点图我们发现12个点基本在一条直线附近,这说明两个变量之间有一个线性相关关系,这个相关关系可以表示为

y =Β0+ Β1x+ ε                                        (2)

这便是y关于x的一元线性回归的数据结构式。通常假定

E(ε) =0,  Var(ε) = σ                                                     (3)

在对未知参数作区间估计或假设检验时,还需要假定误差服从正态分布,即

y ~N(Β0+ Β1x , σ2 )                                 (4)

  显然,假定(4) 比 (3) 要强。

  由于 Β0, Β1均未知,需要我们从收集到的数据(xi,yi),i=1,2,…,n,出发进行估计。在收集数据时,我们一般要求观察独立地进行,即假定y1, y2,…, yn,相互独立。综合上述诸项假定,我们可以给出最简单、常用的一元线性回归的数学模型:

    

  由数据(xi,yi),i=1,2,…,n,可以获得Β0, Β1的估计 ,称

    

  为y关于x的经验回归函数,简称为回归方程,其图形称为回归直线。给定x=x0后, 称回归值(在不同场合也称其为拟合值、预测值)

  2、回归系数的最小二乘估计:

    

    

    

时间: 2024-10-14 11:34:32

高等数理统计(四)的相关文章

【分享】近4000份数学学习资源免费分享给大家

一直以来喜欢收集数学类的教程资源,于是费了好大劲从万千合集站上扒拉了下来,总结归类了一下,一共有将近4000本电子书.经测试,均可免费下载,可能会弹出小广告,可不必理会之.[仅供学术学习和交流,请无用于商业用途.]另外,如有可能,还请尽量支持正版纸质书.   数学史(54)     数学史.rar 55.6 MB   数学的起源与发展.rar 4.3 MB   费马大定理—一个困惑了世间智者358年的谜.pdf 9.5 MB   通俗数学名著译丛14-无穷之旅:关于无穷大的文化史.pdf 14.

2018年秋季学期课表

李理论基础I.II 课程编码:011D9101Z﹡ 课时:80 学分:4.00 课程属性:其它 主讲教师:聂思安 教学目的要求李群和李代数(Lie group and Lie algebra)是在1874年由挪威数学家SophusLie为研究微分方程的对称性而引进的.后经过E. Cartan 和H. Weyl等人的努力,李的理论已成了微分几何的重要研究工具并发展成完整的代数理论.上世纪初,人们发现了李群和李代数在量子物理起重要作用.如今,它在诸如微分几何.偏微分方程.拓扑.数论.控制论.代数编码

Excel基础

目录 一.基础 二.合并单元格 三.等高等宽 四.设置单元格格式 五.换行与强制换行 六.图片 七.页面设置 八.冻结首行 九.序列与自定义序列 十.条件格式 十一.公式 十二.排序 十三.筛选 十四.图表 十五.分列 一.基础 一个Excel文档称为工作簿(workbook).一个工作簿中可以包含多个工作表(sheet) ctrl+向右箭头  查看最后一列 ctrl+向下箭头 查看最后一行 二.合并单元格 三.等高等宽 1.选择整行,整列 2.将鼠标移动到行或列中的分隔处,拖动 四.设置单元格

人工智能人才争抢白热化?学好数学才能C位出道

近代数字重要奠基人之一的德国数学家高斯曾说:"数学是科学的'皇后'."在"大数据"和"人工智能"的浪潮中,算法是核心,而数学.统计学.概率论与算法息息相关. 线性代数:如何将研究对象形式化? 事实上,线性代数不仅仅是人工智能的基础,更是现代数学和以现代数学作为主要分析方法的众多学科的基础.从量子力学到图像处理都离不开向量和矩阵的使用.而在向量和矩阵背后,线性代数的核心意义在于提供了?种看待世界的抽象视角:万事万物都可以被抽象成某些特征的组合,并在

游里工夫独造微一一小平邦彦传

编号:4 小平邦彦,毋庸多言.原文作者是颜一清,发于2001年<数学传播>25卷1期,在此推荐给志趣相投的人. —————————————————————————————————————————— 小平邦彦是第二次世界大战末.日本快战败时才出道的数学家. 他在日本本土逐渐化成焦土, 人在半饥饿状态下, 并在长子濒死的病床边完成的论文“Harmonic fields in Riemannian manifolds (generalized theory)”辗转央托美国驻日军人带到美国后得到发表的

《高等数学第七版》《线性代数(第六版)》《概率论与数理统计(浙大四版)》全套考研教材及解析PDF

资源链接:https://pan.baidu.com/s/1bxEFcGAqAx2iBA9dxKyr5Q考研数学全套基础教材及习题全解数学备考建议:推荐直接看<张宇36讲>,然后结合基础教材<概率论与数理统计(浙大四版)><同济高等数学第七版>以及<同济线性代数(第六版)>进行理解.看张宇的视频是必不可少的,近三年的均可,因为基础内容是一样的.王式安的红皮复习全书可读性有点差,李正元的复习全书又太难,不适合备考.所以极力推荐大家跟着张宇老师一起复习,更多资料

概率论与数理统计 第四版 课后习题答案 习题解析

<概率论与数理统计第四版>是普通高等教育“十一五”国家级规划教材,在2001年出版的概率论与数理统计(第三版)的基础上增订而成. 本次修订新增的内容有:在数理统计中应用Excel,bootstrap方法,P值检验法,箱线图等:同时吸收了国内外优秀教材的优点对习题的类型和数量进行了渊整和充实. 获取方式见文末 概率论与数理统计(第四版) 课后习题解析 第1章 概率论的基本概念课后习题答案 第2章 随机变量及其分布课后习题 第3章 多维随机变量及其分布课后习题 第4章 随机变量的数字特征课后习题

4412开发板三星cortex-A9四核开发板友坚科技

UT4412BV03开发板介绍 4412开发板三星cortex-A9四核开发板友坚科技 友坚恒天科技urbetter.net专注于三星平台产品的研发,是三星在中国最具实力的方案公司.公司主打的三星平板电脑方案销量,连续多年稳居第一.公司定位于中高端产品的研发,具有多年的嵌入式产品研发经验:基于三星 A15-Exynos 5250.A9-Exynos 4412.A8-S5PV210.ARM11-S3C6410.ARM9-S3C2416等处理器,开发了系列化的产品,为客户提供了全面的产品选择及专业化

SQL优化的四个方面,缓存,表结构,索引,SQL语句

一,缓存 数据库属于 IO 密集型的应用程序,其主要职责就是数据的管理及存储工作.而我们知道,从内存中读取一个数据库的时间是微秒级别,而从一块普通硬盘上读取一个IO是在毫秒级别,二者相差3个数量级.所以,要优化数据库,首先第一步需要优化的就是 IO,尽可能将磁盘IO转化为内存IO. query_cache_size/query_cache_type (global) Query cache 作用于整个 MySQL Instance,主要用来缓存 MySQL 中的 ResultSet,也就是一条S