关于机器学习的一些杂谈

晚上睡不着,突然想了一些机器学习中的问题,发现似乎可以类比于生活。因为从某种程度来说,机器学习是模仿人类学习,那么反推回去,机器学习似乎也可以给生活或学习一些启示。

机器学习中的损失函数,是用来衡量一个机器学习模型的好坏程度。通常机器学习的过程就是不断的使得损失函数减少的过程。对于生活与学习来说,就是我们对于一件事情的期望或者自己最终要实现的目标。我们最想做的就是不断的缩小与目标的差距,最终实现目标。

机器学习中模型参数的初值,一般是随机化赋值或用全零进行初始化。在机器学习过程中,好的初值可以减少机器学习迭代的次数;而不好的初值可能会导致最终无法达到全局最优解(当然也取决于你选择求解最优问题的算法)。比如,求解一个非凸问题的全局最优解,若我们使用梯度下降法求解,可能因为初值选择的位置不同,会得到局部最优解或者全局最优解。这就好比一个人在某些方面与生俱来的天赋,似乎并不需要过多的训练就可以比平常的人对于该方面做的要好。而有些人没有很好的天赋,经过了很长时间的训练也取得了很不错的成绩。当然还有一些人很努力但表现出的结果并不好,类比于机器学习中的初值问题,可能他们的天赋与方法并不是很好,只能到达局部的最优,无法实现自我的超越。

机器学习中的深度神经网络(DNN),是通过简单的神经元进行多层次的相连所得到的。它是对人的神经网络的模拟,但又并非完全是模拟人的神经网络的处理过程。DNN看似很简单,但只要赋予它初值,然后不断的训练,总能得到一定的结果。而我看到有一些科学家做过一些实验(一般讲深度神经网络的课程似乎都会引用这些实验),通过不断的训练以及辅助一些传感器,让舌头可以辨别颜色。而对于一种技能(比如某种语言的学习),只要反复的训练,最终都能到达一定的熟练程度。这正如人们所熟知的一万小时定律。

过拟合,是机器学习中一个令人头疼的问题,它指的是机器学习中得到的模型在训练集上具有非常好的性能,但是在测试集上性能却很差。与之相对应的是欠拟合,它指的是在训练集和测试集上性能都很差。在生活中,每当出现一种新兴的事物,年轻人往往要比老年人接收的快些。大概是因为对于新事物相当于机器学习中的测试集,老年人的生活阅历已经很多了,他们可能会处于过拟合的状态。他们对于该事物的预期比该事物本身的结果要差很多,此时若他们不肯改变自己固有的一些思想,就会很难接新事物。相较于年轻人,他们则处于欠拟合的状态,但是由于预期与结果都不好,他们则更容易主动改变思想,从而接受新事物。

生活中,还有一种类似过拟合的情况,比如父母与子女,经常会意见不合。虽然子女继承了父母的基因,但这只是初值可能类似。但由于父母所成长的年代与子女的成长年代有很大的不同,即训练集不同。对于一件事情,可能就是因为父母的过拟合与子女的过拟合导致两代人之间的代沟。

那么,机器学习中的一些问题对我们生活有什么启示?通常,解决某一个机器学习的问题一般的步骤为:

  • 模型选择
  • 策略选择
  • 算法实现
  • 不断训练获取最优解

而我们做事的一般步骤也是如此:

  • 目标一致
  • 方法恰当
  • 持之以恒

还有,关于机器学习中的过拟合现象,一般改善的方法:增加训练集的数据或是正则化。增加训练集的数据,就是要让模型尽可能的考虑到更多的情况;而正则化,则是通过增加惩罚项,使得选择尽可能简单的模型,因为简单的模型往往具有更好的范性。而对于我们的生活和学习来说,为了避免“过拟合”的现象,我们应该学会去接纳一些“新兴”的事物,而不是固守自己的想法。另外,我们也可以尽可能的让自己的生活更简单些,或许就不会有那么多的不愉快了。正如Unix设计哲学中的KISS准则:“Keep it simple, stupid!”

当然,本文纯属个人想法,仅供参考。

原文地址:https://www.cnblogs.com/alants/p/9245888.html

时间: 2024-10-12 00:29:18

关于机器学习的一些杂谈的相关文章

数据杂谈

数据杂谈 目录 前言 数据 数据系统 大数据 数据统计 个性化推荐 总结 参考资料 前言 记得几年前,曾经有人预测过未来最流行的三大技术:大数据.高并发.数据挖掘.到现在来看,这三种技术的确也随着这几年互联网的发展变得越发成熟和可靠.掌握这三种技术的人,不管是求职还是创业,都属于香饽饽.一个很深的印象就是当年研究生毕业的时候,专业是数据挖掘.大数据的学生都比较受各种企业的青睐,不管他是不是真的掌握了这些东西.虽然我对大部分高校的相关专业持怀疑态度,但是却也不得不承认,这些专业的确改变了很多东西,

机器学习必备手册

机器学习是计算机科学的一个子领域,在人工智能领域,机器学习逐渐发展成模式识别和计算科学理论的研究.从2016年起,机器学习到达了不合理的火热巅峰.但是,有效的机器学习是困难的,因为机器学习本身就是一个交叉学科,没有科学的方法及一定的积累很难入门. 如果你也想学习机器学习或者正在学习机器学习,本手册一定会帮助你走向你自己的"人生巅峰".手册包含如何入门机器学习,机器学习流行算法,机器学习实战等等. 一.机器学习入门篇: 1.让你少走弯路:这有一份开展机器学习的简短指南 摘要:本文分享了一

机器学习—逻辑回归理论简介

下面是转载的内容,主要是介绍逻辑回归的理论知识,先总结一下自己看完的心得 简单来说线性回归就是直接将特征值和其对应的概率进行相乘得到一个结果,逻辑回归则是这样的结果上加上一个逻辑函数 这里选用的就是Sigmoid函数,在坐标尺度很大的情况下类似于阶跃函数 在确认特征对应的权重值也就是回归系数的时候 最常用的方法是最大似然法,EM参数估计,这个是在一阶导数能够有解的前提下 如果一阶导数无法求得解析值,那么一般选取梯度上升法,通过有限次的迭代过程,结合代价函数更新回归系数至收敛 //////////

【机器学习实战】Machine Learning in Action 代码 视频 项目案例

MachineLearning 欢迎任何人参与和完善:一个人可以走的很快,但是一群人却可以走的更远 Machine Learning in Action (机器学习实战) | ApacheCN(apache中文网) 视频每周更新:如果你觉得有价值,请帮忙点 Star[后续组织学习活动:sklearn + tensorflow] ApacheCN - 学习机器学习群[629470233] 第一部分 分类 1.) 机器学习基础 2.) k-近邻算法 3.) 决策树 4.) 基于概率论的分类方法:朴素

机器学习 一 监督学习和无监督学习的区别

前话: 最近一直想学机器学习的东西,无奈自己的书太多但无法专心看一本,纯理论的东西看了感觉不记下来就忘记类,所以我想理论学习和实践一起. 所以最近想把机器学习实战这本书看完,并做好记录.加油.!~ 一:什么是监督学习? 监督学习(supervised learning):通过已有的训练样本(即已知数据以及其对应的输出)来训练,从而得到一个最优模型,再利用这个模型将所有新的数据样本映射为相应的输出结果,对输出结果进行简单的判断从而实现分类的目的,那么这个最优模型也就具有了对未知数据进行分类的能力.

R语言使用机器学习算法预测股票市场

quantmod 介绍 quantmod 是一个非常强大的金融分析报, 包含数据抓取,清洗,建模等等功能. 1. 获取数据 getSymbols 默认是数据源是yahoo 获取上交所股票为 getSymbols("600030.ss"), 深交所为 getSymbols("000002.sz").  ss表示上交所, sz表示深交所 2. 重命名函数 setSymbolLookup 3. 股息函数 getDividends 4. 除息调整函数 adjustOHLC

一次失败的却又成功的尝试机器学习经历

一遍看书一遍运行着书中提供的代码,我学习到K-NN分类算法.于是晚上找到一串数据进行尝试. 数据来自于网络1401班C语言教学平台里的数据 首先我对数据进行了简单的处理得到以下结果.这里的分类是对学生的期末考试分数(总评分)和省二级分数综合评定的 最后真正被使用的是txt格式的文件 然后使用了python读取TXT文件,用matplotlib库对数据画图 讲道理确实看不出来有什么规律,大概就是做题少的同学最后至少有一次考试不及格. 然后对数据的随堂测试.自由练习次数进行归一化处理,使用kNN模型

深度学习(deeplearing)(5月完成)共三部分 第一部分应用数学与机器学习(5.1-5.10)线性代数

第一章:线性代数: 学习一个新东西,首先要从概念开始,抓住其核心点 机器学习相关问题中,数据集多是以矩阵的形式存在,而模型的参数如W也是以矩阵或向量的形式存在,所以一个模型从数学的角度来说,就是矩阵间的运算,而运算中矩阵相乘的运算又是最常用的运算.本章后半部分讲解了在机器学习中会用到的一些矩阵运算的概念,如范数.行列式. 特征分解.奇异值分解等 一.基本单元:标量.向量.矩阵.张量 二.

TensorFlow【机器学习】:如何正确的掌握Google深度学习框架TensorFlow(第二代分布式机器学习系统)?

本文标签:   机器学习 TensorFlow Google深度学习框架 分布式机器学习 唐源 VGG REST   服务器 自 2015 年底开源到如今更快.更灵活.更方便的 1.0 版本正式发布,由 Google 推出的第二代分布式机器学习系统 TensorFlow一直在为我们带来惊喜,一方面是技术层面持续的迭代演进,从分布式版本.服务框架 TensorFlow Serving.上层封装 TF.Learn 到 Windows 支持.JIT 编译器 XLA.动态计算图框架 Fold 等,以及