andrew ng machine learning week9 异常检测和推荐系统

异常检测

概率分布的角度:通过判断某个样本的概率分部值和阈值的关系判断是不是异常样本

异常检测的应用:

1. 在线购物网站如何识别异常用户(欺诈行为或者被盗号)

2. 制造业

3. 检测计算机的运行情况

高斯分布

高斯分布开发异常检测算法

步骤

1. 选择一些异常的特征

2. 计算均值和方差,对于每一个特征来进行计算

在这个三维立体图中,越高的地方是正常的地方,异常区则是接近平面0的这些点

如何开发一个关于异常检测的应用

实数评价法的重要性:

不建议把交叉集和测试集混在一起使用

算法的评估过程

常用的查准率和召回率、f1-score

什么时候用异常检测什么时候用监督学习算法

1. 正样本数目小

2. 大量的负样本

3. 许多不同的异常类型

如何设计或选择异常检测算法的特征变量

非高斯特征变量第二种可以通过转换的方式转成钟型曲线

误差分析步骤

看看没能归为异常的点,看能否启发创建新的特征变量

选择特征变量的办法:

不会特别大也不会特别小的值,或者相互组合形成新的特征变量

多元高斯分布

这个×的两个P值都在正常范围内,所以之前的异常检测算法并不能检测出这个错误的绿×

多元高斯的概率公式

协方差矩阵增大和减小所对应的图

仅仅减小一个协方差矩阵的变化

增加对角线上的值的变化

设置为负值的变化

改变u值这个圈圈的中心点会移动

多元高斯的自动检测算法

和原始模型之间的关系

多元高斯函数的协方差矩阵的对角线是特征变量的方差组成,并且其他部分都是0

什么时候选择原始什么时候选择高斯模型?

原始的模型使用地更多,运算量更小

m 远远大于 n 的时候使用多元

协方差矩阵奇异:用于特征项梁或者没满足m>>n的条件

推荐算法

基于内容的推荐系统

协同过滤

这个视频和上一个视频的区别:

用户的特征、电影的特征如何结合在一起可以同时地计算出来呢?

一个是对于评价某电影的全部用户的求和,一个是某个用户看过的全部电影的求和,也就是所有r(i,j)wei 1de qiuhe

然后就是两个正则项的相加

初始化

梯度下降法计算参数

协同过滤算法的向量化实现过程

低秩矩阵分解

两部电影的特征向量非常相似则我们说这两部电影非常相似

原文地址:https://www.cnblogs.com/twomeng/p/9889477.html

时间: 2024-10-11 12:13:24

andrew ng machine learning week9 异常检测和推荐系统的相关文章

Andrew Ng Machine Learning - Week 3:Logistic Regression & Regularization

此文是斯坦福大学,机器学习界 superstar - Andrew Ng 所开设的 Coursera 课程:Machine Learning 的课程笔记.力求简洁,仅代表本人观点,不足之处希望大家探讨. 课程网址:https://www.coursera.org/learn/machine-learning/home/welcome Week 1: Introduction 笔记:http://blog.csdn.net/ironyoung/article/details/46845233 We

Andrew Ng Machine Learning 专题【Linear Regression】

此文是斯坦福大学,机器学习界 superstar - Andrew Ng 所开设的 Coursera 课程:Machine Learning 的课程笔记. 力求简洁,仅代表本人观点,不足之处希望大家探讨. 课程网址:https://www.coursera.org/learn/machine-learning/home/welcome Week 3: Logistic Regression & Regularization 笔记:http://blog.csdn.net/ironyoung/ar

Andrew Ng Machine Learning - Week 1: Introduction

此文是斯坦福大学,机器学习界 superstar - Andrew Ng 所开设的 Coursera 课程:Machine Learning 的课程笔记.力求简洁,仅代表本人观点,不足之处希望大家探讨. 课程网址:https://www.coursera.org/learn/machine-learning/home/welcome Week 1: Introduction Environment Setup Instructions 这一章介绍课程一般使用的工具.octave或者matlab即

Andrew Ng Machine Learning - Week 2

此文是斯坦福大学,机器学习界 superstar - Andrew Ng 所开设的 Coursera 课程:Machine Learning 的课程笔记.力求简洁,仅代表本人观点,不足之处希望大家探讨. 课程网址:https://www.coursera.org/learn/machine-learning/home/welcome Week 2 Multivariate Linear Regression Week 1 讨论仅一个特征,即仅有一个未知量x影响了目标y的取值.如果现在有很多特征?

Andrew Ng Machine Learning - Week 4 & 5- Neural Networks

此文是斯坦福大学,机器学习界 superstar - Andrew Ng 所开设的 Coursera 课程:Machine Learning 的课程笔记.力求简洁,仅代表本人观点,不足之处希望大家探讨. 课程网址:https://www.coursera.org/learn/machine-learning/home/welcome Week 1: Introduction 笔记:http://blog.csdn.net/ironyoung/article/details/46845233 We

andrew ng machine learning week8 非监督学习

聚类——无监督学习的一种算法 K-means算法 最为广泛使用的聚类算法 选择两个聚类中心 簇分配:根据每个样本更接近哪个聚类中心进行样本的分配 簇中心移动:计算出所有的红点类的均值点,移动原始聚类中心到这个点,蓝点类同理 进行不断地迭代直到收敛 输入:K个簇类和训练集样本数据 注意:不需要X0项,为n维向量 算法的描述: 如果最终有个簇中心没有任何点分配给他那么直接移除就可以 K-means常常适用于右侧这种看不出来结构的混乱的数据的聚类的,所以并不是都是左图如此理想的环境 最优化的目标函数

斯坦福机器学习视频笔记 Week9 异常检测和高斯混合模型 Anomaly Detection

异常检测,广泛用于欺诈检测(例如"此信用卡被盗?"). 给定大量的数据点,我们有时可能想要找出哪些与平均值有显着差异. 例如,在制造中,我们可能想要检测缺陷或异常. 我们展示了如何使用高斯分布来建模数据集,以及如何将模型用于异常检测. 我们还将涵盖推荐系统,这些系统由亚马逊,Netflix和苹果等公司用于向其用户推荐产品. 推荐系统查看不同用户和不同产品之间的活动模式以产生这些建议. 在这些课程中,我们介绍推荐算法,如协同过滤算法和低秩矩阵分解. Problem Motivation

Andrew Ng-ML-第十六章-异常检测

1.问题动机 图1.飞机发动机检测例子 对飞机引擎的例子,如果选取了两个特征x1热量产生度,x2震动强度.并得到如下的图,如果有一个新的引擎来检测其是否正常,x_test,那么此时如果点落在和其他点正常内,那么就显示是正常,不需要进一步的检测,但是如果在右下角绿色的,那么就是异常的,需要进一步地检测. 图1.密度检测 更一般地建立模型,当x_test输入时,若概率<阈值ε,那么就被设置为异常:否则设置为正常.如图来看,中心部分的概率大,四周部分概率小. 图2.异常检测的应用 异常检测最常见的应用

Ng Machine learning

Machine learning Preface Definition T: Task E: Experience P: Performance Sequence: T -> E -> P Supervised learning Definition Give the right answer to each example of the data set(called training data). Type Regression: get the continuous values Cla