最近接触了机器学习,感觉很梦幻,能实现的我的梦想,看网上说的花天酒地的难,但是想做就要做下去,毅然决然的跳入这个大坑。
让我们慢慢来,先怼它几个概念。
监督学习
我们给出了关于每个数据的“正确答案”。监督学习必须知道预测什么,即目标变量的分类信息。
监督学习中又有常见的两种问题回归问题和分类问题。
回归问题
回归一词指的是我们根据之前的数据预测出一个准确的连续输出值。
分类问题
当我们想要预测离散的输出值。
几个常用术语
- m:训练样本
- y‘s:输出特征/变量
- x‘s:输入特征/变量
- (x‘i,y‘i):第i组训练样本
监督学习的过程
给定一个训练集(m),一个函数h:x -> y,h(x)是预测Y对应值的一个指标,称为假设。图片为过程:
这是一个学习房屋价格的学习过程。
- Training set:训练数据
- Learning algorithm:学习算法
- h:hypthesis(假设),一个函数
- x:输入变量
- y:输出变量
转变为线性回归的话可以写成 h(x) = a + bx ,b就是斜率,a就是y轴截点,是不是很像y = kx + b。
等之后的梯度下降就知道其作用了。(待续)
时间: 2024-09-30 14:36:35