多项式回归

撰写日期:2017-03-12

多元真实情况未必是线性的,有时需要增加指数项,也就是多项式回归,现实世界的曲线关系都是通过增加多项式实现的,本节介绍用scikit-learn解决多项式回归问题。

1、住房价格成本

样本 面积(平方米) 价格(万元)

样本 面积(平方米)  价格(万元)
1 50 150
2 100 200
3 150 250
4 200 280
5 250 310
6 300 330

2、绘图

 1 import sys
 2 reload(sys)
 3 sys.setdefaultencoding("utf-8")
 4 import matplotlib.pyplot as plt
 5 import numpy as np
 6
 7 plt.figure()## 实例化作图变量
 8 plt.title("single variable")#图像标题
 9 plt.xlabel("x")
10 plt.ylabel("y")
11 plt.axis([30, 400, 100, 400])
12 plt.grid(True) # 是否绘制网格线
13
14 xx = [[50],[100], [150], [200], [250], [300]]
15 yy = [[150], [200], [250], [280], [310], [330]]
16 plt.plot(xx, yy, ‘k.‘)
17 plt.show()

2.1 使用线性回归

1 from sklearn.linear_model import LinearRegression
2 model = LinearRegression()
3 model.fit(xx, yy)
4 x2 = [[30], [400]]
5 y2 = model.predict(x2)
6 print(type(y2))
7 print(y2)
8 plt.plot(x2, y2, ‘g-‘)
9 plt.show()

但是实际情况是,如果房屋面积一味的增加,房价并不会线性增长,因此线性关系已经无法描述真实的房价问题。

2.1 使用多项式回归

时间: 2024-08-09 22:00:24

多项式回归的相关文章

多元线性回归和多项式回归

多项式回归也称多元非线性回归,是指包含两个以上变量的非线性回归模型.对于多元非线性回归模型求解的传统解决方案,仍然是想办法把它转化成标准的线性形式的多元回归模型来处理. 多元非线性回归分析方程 如果自变数与依变数Y皆具非线性关系,或者有的为非线性有的为线性,则选用多元非线性回归方程是恰当的.例如,二元二次多项式回归方程为: 令,及于是上式化为五元一次线性回归方程: 这样以来,便可按多元线性回归分析的方法,计算各偏回归系数,建立二元二次多项式回归方程. -参考文献:智库百科,点击打开 多元二项式回

多项式回归模型(Office Prices)

题目:https://www.hackerrank.com/challenges/predicting-office-space-price 分析:还是上次的房价预测题目,指明要用多项式回归拟合.在多元多项式拟合时候,目标函数表示如下 对其目标函数求偏导得到 很容易写出代码. 代码: #coding:utf-8 import math class Data: def __init__(self): self.x = [] self.y = 0.0 def makeMatrix(row, col,

多项式回归学习笔记

操作系统 : CentOS7.3.1611_x64 python版本:2.7.5 sklearn版本:0.18.2 tensorflow版本 :1.2.1 多项式的定义及展现形式 多项式(Polynomial)是代数学中的基础概念,是由称为不定元的变量和称为系数的常数通过有限次加减法.乘法以及自然数幂次的乘方运算得到的代数表达式. 多项式分为一元多项式和多元多项式,其中: 不定元只有一个的多项式称为一元多项式: 不定元不止一个的多项式称为多元多项式. 本文讨论的是一元多项式相关问题. 其一般形式

机器学习之——多项式回归和正规方程

上一次我们分享了多变量线性回归模型(Linear Regression with Multiple Variables),这一次我们来讨论一下多项式回归(Polynomial Regression) 和正规方程(Normal Equation).(我们还是讨论房价预测的问题) 多项式回归 有时候,线性回归并不适用于所有全部的数据,我们需要曲线来适应我们的数据,比如一个二次方模型: 或者一个三次方模型: 这两个模型我们在坐标系绘图如下: 通常情况,我们需要先观察数据然后再去决定使用怎样的模型来处理

多项式回归(Polynomial Regression)

在拿到一组数据时,我们需要先观察数据选择特征甚至构造特征,然后选择合适的模型. 线性回归并不适用所有数据,有时候我们需要用曲线来拟合我们的数据. 比如一个二次模型:   或者三次模型: 对于多项式模型,我们可以构造特征如: x2 = x22 x3 = x33 从而可以把模型转化为线性回归模型. 注:在构造特征(模型选择)时,应充分观察数据分布以及大致的函数图形特征.比如上面的数据我们可以有以下两种选择: 另外,对于多项式回归模型,构造完特征之后一般各特征的尺度都不一样甚至都相差很大,所以特征缩放

线性回归、多项式回归

前言 以下内容是个人学习之后的感悟,如果有错误之处,还请多多包涵~ 简介 回归属于有监督学习中的一种方法.该方法的核心思想是从连续型统计数据中得到数学模型,然后将该数学模型用于 预测或者分类.该方法处理的数据可以是多维的. 一.线性回归 原理: 在连续型统计数据情况下,选取大量的样本数据,如下图中的红色十字表示的(x,y)值,根据这些样本的趋势, 选择合适的假设函数,此处选择的是线性回归的假设函数.根据样本,计算代价函数的极小值,此时的θ值就是我们 需要得到的数学模型的参数值. 计算代价函数的极

scikit-learn : 线性回归,多元回归,多项式回归

匹萨的直径与价格的数据 %matplotlib inline import matplotlib.pyplot as plt def runplt(): plt.figure() plt.title(u'diameter-cost curver') plt.xlabel(u'diameter') plt.ylabel(u'cost') plt.axis([0, 25, 0, 25]) plt.grid(True) return plt plt = runplt() X = [[6], [8],

机器学习(八) 多项式回归与模型泛化(上)

一.什么是多项式回归 直线回归研究的是一个依变量与一个自变量之间的回归问题,但是,在畜禽.水产科学领域的许多实际问题中,影响依变量的自变量往往不止一个,而是多个,比如绵羊的产毛量这一变量同时受到绵羊体重.胸围.体长等多个变量的影响,因此需要进行一个依变量与多个自变量间的回归分析,即多元回归分析. 研究一个因变量与一个或多个自变量间多项式的回归分析方法,称为多项式回归(Polynomial Regression).如果自变量只有一个时,称为一元多项式回归:如果自变量有多个时,称为多元多项式回归.在

机器学习(八) 多项式回归与模型泛化(下)

六.验证数据集与交叉验证 七.偏差方差平衡 偏差方差权衡 Bias Variance Trade off 偏差 Bias 导致偏差的主要原因: 对问题本身的假设不正确! 如:非线性数据使用线性回归 欠拟合 underfitting 方差 Variance 数据的一点点扰动都会较大的影响模型 通常原因,使用的模型太复杂 如高阶多项式回归. 过拟合 overfitting 偏差和方差 有一些算法天生高方差,KNN 非参数学习通常都是高方差算法.因为不对数据进行任何假设. 有一些算法天生是高偏差算法.