五、regularized线性回归练习(转载)

转载链接:http://www.cnblogs.com/tornadomeet/archive/2013/03/17/2964515.html

前言:

  本节主要是练习regularization项的使用原则。因为在机器学习的一些模型中,如果模型的参数太多,而训练样本又太少的话,这样训练出来的模型很容易产生过拟合现象。因此在模型的损失函数中,需要对模型的参数进行“惩罚”,这样的话这些参数就不会太大,而越小的参数说明模型越简单,越简单的模型则越不容易产生过拟合现象。本文参考的资料参考网页:http://openclassroom.stanford.edu/MainFolder/DocumentPage.php?course=DeepLearning&doc=exercises/ex5/ex5.html。主要是给定7个训练样本点,需要用这7个点来模拟一个5阶多项式。主要测试的是不同的regularization参数对最终学习到的曲线的影响。

  实验基础:

  此时的模型表达式如下所示:

  

  模型中包含了规则项的损失函数如下:

  

  模型的normal equation求解为:

  

  程序中主要测试lambda=0,1,10这3个参数对最终结果的影响。

  一些matlab函数:

  plot:

  主要是将plot绘曲线的一些性质。比如说:plot(x,y,‘o‘,‘MarkerEdgeColor‘,‘b‘,‘MarkerFaceColor‘,‘r‘)这里是绘制x-y的点图,每个点都是圆圈表示,圆圈的边缘用蓝色表示,圆圈里面填充的是红色。由此可知’MarkerEdgeColor’和’MarkerFaceColor’的含义了。

  diag:

  diag使用来产生对角矩阵的,它是用一个列向量来生成对角矩阵的,所以其参数应该是个列向量,比如说如果想产生3*3的对角矩阵,则可以是diag(ones(3,1)).

  legend:

  注意转义字符的使用,比如说legned(‘\lambda_0’),说明标注的是lamda0.

  实验结果:

  样本点的分布和最终学习到的曲线如下所示:

  

  可以看出,当lambda=1时,模型最好,不容易产生过拟合现象,且有对原始数据有一定的模拟。

实验主要代码:

clc,clear
%加载数据
x = load(‘ex5Linx.dat‘);
y = load(‘ex5Liny.dat‘);

%显示原始数据
plot(x,y,‘o‘,‘MarkerEdgeColor‘,‘b‘,‘MarkerFaceColor‘,‘r‘)

%将特征值变成训练样本矩阵
x = [ones(length(x),1) x x.^2 x.^3 x.^4 x.^5];
[m n] = size(x);
n = n -1;

%计算参数sidta,并且绘制出拟合曲线
rm = diag([0;ones(n,1)]);%lamda后面的矩阵
lamda = [0 1 10]‘;
colortype = {‘g‘,‘b‘,‘r‘};
sida = zeros(n+1,3);
xrange = linspace(min(x(:,2)),max(x(:,2)))‘;
hold on;
for i = 1:3
    sida(:,i) = inv(x‘*x+lamda(i).*rm)*x‘*y;%计算参数sida
    norm_sida = norm(sida)
    yrange = [ones(size(xrange)) xrange xrange.^2 xrange.^3,...
        xrange.^4 xrange.^5]*sida(:,i);
    plot(xrange‘,yrange,char(colortype(i)))
    hold on
end
legend(‘traning data‘, ‘\lambda=0‘, ‘\lambda=1‘,‘\lambda=10‘)%注意转义字符的使用方法
hold off
时间: 2024-08-10 15:06:51

五、regularized线性回归练习(转载)的相关文章

转载 Deep learning:五(regularized线性回归练习)

前言: 本节主要是练习regularization项的使用原则.因为在机器学习的一些模型中,如果模型的参数太多,而训练样本又太少的话,这样训练出来的模型很容易产生过拟合现象.因此在模型的损失函数中,需要对模型的参数进行"惩罚",这样的话这些参数就不会太大,而越小的参数说明模型越简单,越简单的模型则越不容易产生过拟合现象.本文参考的资料参考网页:http://openclassroom.stanford.edu/MainFolder/DocumentPage.php?course=Dee

机器学习笔记(五)线性回归

一.线性回归问题 输入的是特征向量,输出为实数,对于,,模型函数为 衡量误差为平方错误,则Ein为, Eout为未来没有看过的数据资料在模型函数上所得的错误 二.线性回归算法 由Ein可得 目的是求得Ein最小,可知在最低点时Ein最小,即梯度为0的时候 由, 如同,可知 其中 令,可得 输入矩阵X在很少的情况下才是方阵(N=d+1时),在大部分的情况下是可逆的,原因是在进行机器学习时,通常满足 ,即样本数量N远远大于样本的维度d加1,因此在中存在足够的自由度使其可以满足可逆的条件. 另一种是不

PHP读取文件内容的五种方式(转载)

php读取文件内容的五种方式 分享下php读取文件内容的五种方法:好吧,写完后发现文件全部没有关闭.实际应用当中,请注意关闭 fclose($fp); php读取文件内容: -----第一种方法-----fread()-------- 1 <?php 2 $file_path = "test.txt"; 3 if(file_exists($file_path)){ 4 $fp = fopen($file_path,"r"); 5 $str = fread($f

Spring中bean的五个作用域简介(转载)

Spring上个版本的IoC容器支持两个不同的bean作用域(单例与原型).Spring 2.0改进了这一点,不仅提供了一些依赖于Spring部署环境(比如说,在web环境中的request和session作用域bean)的额外的作用域,而且提供了所谓的'钩子'('hooks')(因为找不到更好的表达)使Spring用户可以创造自己的作用域. 应该注意的是,即使单例与原型作用域beans的基本(内在)实现发生了变化,上述变化对最终用户来说是透明的...现有的配置不需要改变或放弃. 如何使用spr

第五章 springboot + mybatis(转载)

本编博客转发自:http://www.cnblogs.com/java-zhao/p/5350021.html springboot集成了springJDBC与JPA,但是没有集成mybatis,所以想要使用mybatis就要自己去集成.集成方式相当简单. 1.项目结构 2.pom.xml 1 <!-- 与数据库操作相关的依赖 --> 2 <dependency> 3 <groupId>org.springframework.boot</groupId> 4

转载 Deep learning:六(regularized logistic回归练习)

前言: 在上一讲Deep learning:五(regularized线性回归练习)中已经介绍了regularization项在线性回归问题中的应用,这节主要是练习regularization项在logistic回归中的应用,并使用牛顿法来求解模型的参数.参考的网页资料为:http://openclassroom.stanford.edu/MainFolder/DocumentPage.php?course=DeepLearning&doc=exercises/ex5/ex5.html.要解决的

六、regularized logisitic regssion练习(转载)

转载链接:http://www.cnblogs.com/tornadomeet/archive/2013/03/17/2964858.html 在上一讲Deep learning:五(regularized线性回归练习)中已经介绍了regularization项在线性回归问题中的应用,这节主要是练习regularization项在logistic回归中的应用,并使用牛顿法来求解模型的参数.参考的网页资料为:http://openclassroom.stanford.edu/MainFolder/

线性回归原理小结

线性回归可以说是机器学习中最基本的问题类型了,这里就对线性回归的原理和算法做一个小结. 1. 线性回归的模型函数和损失函数 线性回归遇到的问题一般是这样的.我们有m个样本,每个样本对应于n维特征和一个结果输出,如下: (x(0)1,x(0)2,...x(0)n,y0),(x(1)1,x(1)2,...x(1)n,y1),...(x(m)1,x(m)2,...x(m)n,yn)(x1(0),x2(0),...xn(0),y0),(x1(1),x2(1),...xn(1),y1),...(x1(m)

Linux五种IO模型

Linux五种IO模型 转载:http://blog.csdn.net/jay900323/article/details/18141217 Linux五种IO模型性能分析 目录(?)[-] 概念理解 Linux下的五种IO模型 阻塞IO模型 非阻塞IO模型 IO复用模型 信号驱动IO 异步IO模型 个IO模型的比较 selectpollepoll简介 1. 概念理解 在进行网络编程时,我们常常见到同步(Sync)/异步(Async),阻塞(Block)/非阻塞(Unblock)四种调用方式: