这篇记录的内容来自于Andrew Ng教授在coursera网站上的授课。
1.不要浪费大量的时间在获得样本上。实际上,太多的样本数并不会使学习算法更加的优秀。要尝试调整你的系数:
1.使用更少的特征。
2.增加多项式。
3.调整$\lambda$。
2.诊断学习算法:
1.将样本打乱,并将其中一部分作为训练样本,剩下的作为测试样本,来判断是否出现了过拟合。
2.将样本划分为三类:训练集,交叉验证(cross validation,cv)集,测试集。对于线性回归,训练集来得出相应次数下的theta,交叉验证集来比较这些theta,获得最好的模型,测试集继续训练模型。
1.支持向量机(support vector machine,SVM):
原文地址:https://www.cnblogs.com/GreenDuck/p/12342551.html
时间: 2024-10-09 17:42:47