机器学习入门(一)

  上大学的时候人工智能火了一段时间(虽然现在还是虚假的繁荣现象),但是不得不说人工只能肯定是未来的发展方向,所以我们就有必要了解其基本的理论原理,当然了我写出来的东西肯定不会和数学特别相关,因为我概率论差啊,那段时间沉迷游戏,然后60多分飘过,所以各位肯定是比我牛逼的。我参考的书籍是《机器学习及实践》范淼 李超编著

  基础理论:

    1.Logistic函数,其实就是类似于电流脉冲,只不过中间的跳变是过度的(正半轴图像类似于根号函数,0附近斜率大),上下界是+1和-1,然后就有了当x=0的时候,y=0.5,在x左边,y很快远小于0.5,右边y就很快大于0.5于是就把y分成了两类

    2.支持向量机,比如在平面坐标轴的第一象限里有两部分聚集的点,这些点可以使用一条直线y = kx +b来将这两种点分开,那么这种方式就叫支持向量机

    3.朴素贝叶斯,概率论太差没看懂,,,哪位给推荐比较好的概率论课啊?

    4.K近邻算法(以点为例,红点和蓝点),就是看这个待测样本点,如果这个点附近的K(K使我们设置的)个点都是红点,那么将这个点归类为红点,否则归类为蓝点

    5.决策树,这个好像就是数据结构里面的树,深究的话还有什么特征点的选取顺序,度量方式有信息熵和基尼不纯性,不过,入门,入门,这些应该初中生都能听得懂.

    //以上是监督学习经典模型

    //以下是无监督学习经典模型

    1.k均值算法比较复杂(以一维点们为例,有几簇点),可以分为四个阶段

      第一阶段:随机布设K个特征空间内容的点作为初始的聚类中心(假设有三堆点,一堆红点,一堆蓝点,一堆黄点,那么这里就有了三个聚类中心,这里的K可以多找几个)

      第二阶段:从K个聚类中心中找到距离最近的一个,并且把该点标记为从属于这个聚类中心

      第三阶段:在所有的数据都被标记过聚类中心后,根据这些重新分完簇的点再进行计算

      第四阶段:如果上面得到的结果和上一次分配的类簇一样,算法结束,否则跳到第二阶段继续执行

    2.特征降维:听说过降维打击吗???比如说一个妹子,然后我们用二向箔将她搞到二次元,然后她就可以变成你们老婆了,嗯……所以这个特征降维就是通过一个函数(二向箔)将一个高纬的物体(妹子)映射到低维(你们的二次元)的一种算法

原文地址:https://www.cnblogs.com/tell-me-why-not/p/9533421.html

时间: 2024-08-30 18:30:49

机器学习入门(一)的相关文章

机器学习入门资源--汇总

机器学习入门资源--汇总 基本概念 机器学习 机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论.统计学.逼近论.凸分析.算法复杂度理论等多门学科.机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法.机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法.因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论.算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法. 下面从微观到宏观试着梳理一下机器学习的范畴:

机器学习入门:线性回归及梯度下降

机器学习入门:线性回归及梯度下降 本文会讲到: (1)线性回归的定义 (2)单变量线性回归 (3)cost function:评价线性回归是否拟合训练集的方法 (4)梯度下降:解决线性回归的方法之一 (5)feature scaling:加快梯度下降执行速度的方法 (6)多变量线性回归   Linear Regression 注意一句话:多变量线性回归之前必须要Feature Scaling! 方法:线性回归属于监督学习,因此方法和监督学习应该是一样的,先给定一个训练集,根据这个训练集学习出一个

机器学习入门——单变量线性回归

线性回归的概念,在高中数学书里就出现过. 给你一些样本点,如何找出一条直线,使得最逼近这些样本点. 给出一个例子:假设 x 是房子面积,y是房子价格,确定一条直线需要theta0和theta1. 给出x,我们就可以计算出房子的价格 h(x) = theta0+theta1*x 关键是如何计算出theta0和theta1,也就是如何找出这么一条直线呢? 在这里,引入一个概念,叫做cost function.m表示样本个数,也就是训练样本数目 这是一个square error,学过统计的应该经常见到

【转载】机器学习入门者学习指南(经验分享)

机器学习入门者学习指南(经验分享) 2013-09-21 14:47 本人计算机研二,专业方向自然语言处理,个人对于机器学习挺感兴趣,于是开始学习.所以,原来这家伙是个菜鸟……正是由于自己是个菜鸟,所以体会到自学机器学习的艰辛,于是在这里分享一下个人的经验,希望能对入门者有所帮助.一些有关机器学习的介绍在这里就不做详细介绍了,感兴趣的同学可以去维基百科.就直接进入正题.1.去Coursera上Andrew Ng的<机器学习>,完成所有作业,最好能全部拿满分.这是相当入门的课程,老师是机器学习领

机器学习入门 - 1. 介绍与决策树(decision tree)

机器学习(Machine Learning) 介绍与决策树(Decision Tree) 机器学习入门系列 是 个人学习过程中的一些记录与心得.其主要以要点形式呈现,简洁明了. 1.什么是机器学习? 一个比较概括的理解是: 根据现有的数据,预测未来 2.核心思想 : Generalization 可以理解为,归纳.概括.就像是人的学习一样,找出一件事物与与一件事物的联系 3.归纳性的机器学习(Inductive machine learning) 其核心思想是使用训练数据,并从其中摸索出一套适用

老司机学python篇:第一季(基础速过、机器学习入门)

详情请交流  QQ  709639943 00.老司机学python篇:第一季(基础速过.机器学习入门) 00.Python 从入门到精通 78节.2000多分钟.36小时的高质量.精品.1080P高清视频教程!包括标准库.socket网络编程.多线程.多进程和协程. 00.Django实战之用户认证系统 00.Django实战之企业级博客 00.深入浅出Netty源码剖析 00.NIO+Netty5各种RPC架构实战演练 00.JMeter 深入进阶性能测试体系 各领域企业实战 00.30天搞

机器学习入门-文本特征-word2vec词向量模型 1.word2vec(进行word2vec映射编码)2.model.wv[&#39;sky&#39;]输出这个词的向量映射 3.model.wv.index2vec(输出经过映射的词名称)

函数说明: 1. from gensim.model import word2vec  构建模型 word2vec(corpus_token, size=feature_size, min_count=min_count, window=window, sample=sample) 参数说明:corpus_token已经进行切分的列表数据,数据格式是list of list , size表示的是特征向量的维度,即映射的维度, min_count表示最小的计数词,如果小于这个数的词,将不进行统计,

web安全之机器学习入门——3.1 KNN/k近邻算法

目录 sklearn.neighbors.NearestNeighbors 参数/方法 基础用法 用于监督学习 检测异常操作(一) 检测异常操作(二) 检测rootkit 检测webshell sklearn.neighbors.NearestNeighbors 参数: 方法: 基础用法 print(__doc__) from sklearn.neighbors import NearestNeighbors import numpy as np X = np.array([[-1, -1],

【机器学习】机器学习入门08 - 聚类与聚类算法K-Means

时间过得很快,这篇文章已经是机器学习入门系列的最后一篇了.短短八周的时间里,虽然对机器学习并没有太多应用和熟悉的机会,但对于机器学习一些基本概念已经差不多有了一个提纲挈领的了解,如分类和回归,损失函数,以及一些简单的算法--kNN算法.决策树算法等. 那么,今天就用聚类和K-Means算法来结束我们这段机器学习之旅. 1. 聚类 1.1 什么是聚类 将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类.由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他

机器学习入门实践——线性回归&非线性回归&mnist手写体识别

把一本<白话深度学习与tensorflow>给啃完了,了解了一下基本的BP网络,CNN,RNN这些.感觉实际上算法本身不是特别的深奥难懂,最简单的BP网络基本上学完微积分和概率论就能搞懂,CNN引入的卷积,池化等也是数字图像处理中比较成熟的理论,RNN使用的数学工具相对而言比较高深一些,需要再深入消化消化,最近也在啃白皮书,争取从数学上把这些理论吃透 当然光学理论不太行,还是得要有一些实践的,下面是三个入门级别的,可以用来辅助对BP网络的理解 环境:win10 WSL ubuntu 18.04