转自: 正态分布的前世今生(上) 正态分布的前世今生(下) 在终极的分析中,一切知识都是历史 在抽象的意义下,一切科学都是数学 在理性的基础上,所有的判断都是统计学 —C.R.Rao 时间: 2024-12-25 01:58:57
http://songshuhui.net/archives/77386 作 者: rickjin(靳志辉??) 校 对: 汤涛,香港浸会大学数学讲座教授 正态分布的前世今生(上) 六.开疆扩土,正态分布的进一步发展 19世纪初,随着拉普拉斯中心极限定理的建立与高斯正态误差理论的问世,正态分布开始崭露头角,逐步在近代概率论和数理统计学中大放异彩.在概率论中,由于拉普拉斯的推动,中心极限定理发展成为现代概率论的一块基石.而在数理统计学中,在高斯的大力提倡之下,正态分布开始逐步畅行于天下. 6.1
神说,要有正态分布,就有了正态分布.神看正态分布是好的,就让随机误差服从了正态分布.创世纪—数理统计 1. 正态分布,熟悉的陌生人 学过基础统计学的同学大都对正态分布非常熟悉.这个钟形的分布曲线不但形状优雅,它对应的密度函数写成数学表达式 f(x)=12π−−√σe−(x−μ)22σ2 也非常具有数学的美感.其标准化后的概率密度函数 f(x)=12π−−√e−x22 更加的简洁漂亮,两个最重要的数学常量 π.e 都出现在这公式之中.在我个人的审美之中,它也属于 top-N 的最美丽的数学公式之一
本文作者简介:王夜笙,就读于郑州大学信息工程学院,感兴趣的方向为逆向工程和机器学习,长期从事数据抓取工作(长期与反爬虫技术作斗争~),涉猎较广(技艺不精……),详情请见我的个人博客~ 个人博客地址:http://bindog.github.io/blog/ 邮箱:[email protected] 感谢怡轩同学的悉心指导~ 之前拜读了靳志辉(@rickjin)老师写的<正态分布的前世今生>,一直对正态分布怀着一颗敬畏之心,刚好最近偶然看到python标准库中如何生成服从正态分布随机数的源码,觉
过拟合 ??我们都知道,在进行数据挖掘或者机器学习模型建立的时候,因为在统计学习中,假设数据满足独立同分布(i.i.d,independently and identically distributed),即当前已产生的数据可以对未来的数据进行推测与模拟,因此都是使用历史数据建立模型,即使用已经产生的数据去训练,然后使用该模型去拟合未来的数据.但是一般独立同分布的假设往往不成立,即数据的分布可能会发生变化(distribution drift),并且可能当前的数据量过少,不足以对整个数据集进行分
http://blog.csdn.net/v_july_v/article/details/8308762 数据挖掘中所需的概率论与数理统计知识 (关键词:微积分.概率分布.期望.方差.协方差.数理统计简史.大数定律.中心极限定理.正态分布) 导言:本文从微积分相关概念,梳理到概率论与数理统计中的相关知识,但本文之压轴戏在本文第4节(彻底颠覆以前读书时大学课本灌输给你的观念,一探正态分布之神秘芳踪,知晓其前后发明历史由来),相信,每一个学过概率论与数理统计的朋友都有必要了解数理统计学简史,因为,
本文为转载,源地址为:http://blog.chinaunix.net/uid-10314004-id-3594337.html 机器学习的资料较多,初学者可能会不知道怎样去有效的学习,所以对这方面的资料进行了一个汇总,希望能够对和我一样的初学者有一定的借鉴. 1. 数学基础 机器学习是构建于数学的基础之上的,因此只有把数学的基本功打好,才能够在机器学习领域有长远的发展.正所谓”勿在浮沙筑高台“. 微积分:微积分学教程 (F.M.菲赫金哥尔茨)俄罗斯的数学书 线性代数:Linear Al
支持向量机通俗导论(理解SVM的三层境界) 作者:July .致谢:pluskid.白石.JerryLead.说明:本文最初写于2012年6月,而后不断反反复复修改&优化,修改次数达上百次,最后修改于2016年11月. 前言 动笔写这个支持向量机(support vector machine)是费了不少劲和困难的,原因很简单,一者这个东西本身就并不好懂,要深入学习和研究下去需花费不少时间和精力,二者这个东西也不好讲清楚,尽管网上已经有朋友写得不错了(见文末参考链接),但在描述数学公式的时候还是显
作者:July.pluskid :致谢:白石.JerryLead 出处:结构之法算法之道blog. 前言 动笔写这个支持向量机(support vector machine)是费了不少劲和困难的,原因很简单,一者这个东西本身就并不好懂,要深入学习和研究下去需花费不少时间和精力,二者这个东西也不好讲清楚,尽管网上已经有朋友写得不错了(见文末参考链接),但在描述数学公式的时候还是显得不够.得益于同学白石的数学证明,我还是想尝试写一下,希望本文在兼顾通俗易懂的基础上,真真正正能足以成为一篇完整概括和介
转自:http://blog.csdn.net/macyang/article/details/38782399 第一层.了解SVM 1.0.什么是支持向量机SVM 要明白什么是SVM,便得从分类说起. 分类作为数据挖掘领域中一项非常重要的任务,它的目的是学会一个分类函数或分类模型(或者叫做分类器),而支持向量机本身便是一种监督式学习的方法(至于具体什么是监督学习与非监督学习,请参见此系列Machine L&Data Mining第一篇),它广泛的应用于统计分类以及回归分析中. 支持向量机(SV