机器学习ML策略

1、为什么是ML策略

例如:识别cat分类器的识别率是90%,怎么进一步提高识别率呢?

想法:

(1)收集更多数据

(2)收集更多的多样性训练样本

(3)使用梯度下降训练更长时间

(4)尝试Adam代替梯度下降

(5)尝试更大的网络

(6)尝试更小的网络

(7)尝试dropout

(8)尝试L2正则化

(9)修改网络架构(激励函数,隐含层单元数目)

2、正交化

正交化(正交性)是一种系统设计属性,它可以确保修改算法的一个指令或者组成部分将不会对系统的其他组成部分产生或者传播副作用。使得核查算法变得容易,减少测试和开发算法的时间。

一个好的机器学习算法按算法流程需要满足(正交化):

(1)在训练集中表现好(接近人类)。如果不好,可换大型网络或者更换优化算法

(2)在验证集中表现好。如果不好,可尝试正则化或者使用大一点规模的训练集

(3)在测试集中表现好。如果不好,可尝试大一点的验证集

(4)在真实世界中表现好。如果不好,测试集不正确或者代价函数有问题

3、单一数字评估指标

混淆矩阵:

True Positive(TP):正类预测为正类

True Negtive(TN):负类预测为负类

False Positive(FP):负类预测为正类(误报)

False Negative(FN):正类预测为负类(漏报)

  Positive Negative
True TP TN
False FP FN

精确率(precision):针对预测结果而言的,它表示的是预测为正的样本中有多少是对的

P = TP/(TP+FP)

准确率(accuracy):ACC = (TP+TN)/(TP+TN+FP+FN)

召回率(recall):针对我们原来的样本而言的,它表示的是样本中的正例有多少被预测正确的

R = TP/(TP+FN)

F1值:2/F1 = 1/P +1/R      --->       F1 = 2TP/(2TP+FP+FN)

在信息检索领域,精确率和召回率又被称为查准率查全率

查准率=检索出的相关信息量 / 检索出的信息总量

查全率=检索出的相关信息量 / 系统中的相关信息总量

时间: 2024-12-14 18:13:14

机器学习ML策略的相关文章

机器学习(ML)中文视频教程

本节是李政軒Cheng-Hsuan Li的关于机器学习一些算法的中文视频教程.讲得很好不错,这里非常感谢他的分享:http://www.powercam.cc/chli.也贴到这里,和大家共同学习. Clustering Fuzzy C-Means 基本概念(第1部分) Fuzzy C-Means 基本概念(第2部分) Fuzzy C-Means 基本概念(第3部分) Fuzzy C-Means 迭代公式推導 Regression Linear Regression Models-1 Linea

机器学习 - ML

CNCC - 2016 | 机器学习(原文链接) Machine Learning - ML,机器学习是人工智能AI的一个分支. 参考: :

认识:人工智能AI 机器学习 ML 深度学习DL

人工智能 人工智能(Artificial Intelligence),英文缩写为AI.它是研究.开发用于模拟.延伸和扩展人的智能的理论.方法.技术及应用系统的一门新的技术科学. 人工智能是对人的意识.思维的信息过程的模拟.人工智能不是人的智能,但能像人那样思考.也可能超过人的智能. 人工智能的定义可以分为两部分,即"人工"和"智能". 机器学习 1.    什么是机器学习 根据等人事件中判断人是否迟到了解什么是机器学习,具体参见地址:http://www.cnblo

人工智能与机器学习的不同之处

人工智能早已不是一个新名词,它的发展历史已经有几十年.从80年代早期开始,当时计算机科学家设计出可以学习和模仿人类行为的算法.在学习方面,最重要的算法是神经网络,但由于模型过于强大,没有足够的数据支持,导致不是很成功.然而,在一些更具体的任务中,使用数据来适应函数的想法获得了巨大的成功,这也构成了机器学习的基础. 人工智能早已不是一个新名词,它的发展历史已经有几十年.从80年代早期开始,当时计算机科学家设计出可以学习和模仿人类行为的算法.在学习方面,最重要的算法是神经网络,但由于模型过于强大,没

机器学习如何撬开千亿视频商业化大市场?

(上图为智能视频图像分析创业公司Viscovery CEO黄俊杰) 在线视频正在迅速成长为一个巨大的市场.根据今年6月发布的思科Visual Networking Index(VNI)报告显示,到2020年视频将占消费互联网流量的82%,2015 年到 2020 年互联网视频监控流量将增长十倍.全球虚拟现实流量将增长61倍.在中国市场,根据市场调查公司艾瑞的预测,在线视频市场将在2018年达近千亿人民币规模. 面对这样一个视频大市场,如何进行视频的商业化转化,是所有运营商和互联网公司关注的焦点.

最牛逼的开源机器学习框架,你知道几个

最牛逼的开源机器学习框架,你知道几个 机器学习毫无疑问是当今最热的话题,它已经渗透到生活的方方面面,在移动互联网中混不懂点机器学习都不好意思,说几个能看的到的,经常用邮箱吧,是不是感觉垃圾邮件比N年前变少了,无聊了和siri聊过天不,想坐一下无人驾驶汽车吗,手累了用脸解个锁,智能化产品推荐是不是让你更懒了.看不到的就更多了:信用卡欺诈监测保证你的交易安全,股票交易/量化投资(知道你的高收益理财怎么来的吗?),手势识别(用过海豚浏览器的手势吗),还有医学分析等等,巨头们为了在未来占领先机,前仆后继

机器学习与量化交易项目班 [从零搭建自动交易系统]

第一课 自动化交易综述知识点1: 课程内容综述,自动化/算法交易介绍,python在自动交易中的应用简介第二课 量化交易系统综述知识点1:回测,自动交易,策略建模,常见平台使用第三课 搭建自己的量化数据库知识点1:软件需求,数据获取方式,数据存储方式实战项目:金融数据的存储,读取第四课 用Python进行金融数据分析知识点1:数据清理与特征选择实战项目:pandas与金融数据分析第五课 策略建模综述知识点1:介绍量化交易中的策略建模流程及主要处理方式第六课 策略建模:基于机器学习的策略建模实战项

「01」机器学习,到底在学些什么?

阅读 0 编辑文章 大家好,欢迎来到久违的机器学习系列,这是「美团」算法工程师带你入门机器学习 专栏的第一篇文章,不会太长,一半聊想法,一半聊干货.熟悉我的朋友可能知道,我以前的文章比较随意,涉及的内容极广,包括但不限于Python/Java/C/C++,网络编程,Hadoop等,但主要核心还是机器学习算法和数据科学相关的主题,这一点没变过. 最近认真总结和思考了之前的博客内容,决定将自己从入门到现在一路走来的学习经验和理解整理一番,帮助更多后来的小伙伴更好的入门,所以就有了这个系列.以前的知乎

吴恩达《深度学习》第三门课(1)机器学习策略一

1.1为什么是ML策略 (1)当对一个实际的应用系统进行优化时,可能有很多想法:如提高数据量,提高网络深度,正则化等等,一个错误的选择可能浪费非常多的时间,本课就是让你在面对很多选择时做出正确的选择,这就是ML策略.提高效率,让你的深度学习系统更快投入使用. 1.2正交化 (1)使用以下的老式电视机来说明什么是正交化,即一个按钮只调节宽度(不会对其他造成影响),一个只调节高度,一个只调节角度,这样就可以很容易的讲画面调节到正中央,如果一个按钮既影响高度有影响角度,那么将非常难调整. (2)同样在