线性回归预测波士顿房价

预测波士顿的房价,上次已经通过房间数目预测了房价,这次用多元线性回归预测。

根据之前推导的多元线性回归的参数

接下来是多元线性回归的代码实现

def LinearRegression_(x,y):
    np.array(x)
    np.array(y)
    a = (np.linalg.inv(x.T.dot(x))).dot(x.T).dot(y)

上次大致了解了得个feature的name。下面是‘ZN’和‘RM’的散点图(由于我比较懒所以只实现这两个)

我们可以看出每个特征的数据范围相差较大,为了加快梯度下降求最优解的速度,将它们进行归一化处理

from sklearn import preprocessing
min_max_scaler = preprocessing.MinMaxScaler()
#分别对训练和测试数据的特征以及目标值进行标准化处理
boston[‘data‘]=min_max_scaler.fit_transform(boston[‘data‘])
boston[‘target‘]=min_max_scaler.fit_transform(boston[‘target‘].reshape(-1,1))

在对y进行标准化的时候会报错,因此要对boston[‘target‘]reshape()。下面就是进行数据划分和预测

x = pd.DataFrame(boston[‘data‘],columns=boston[‘feature_names‘])
y = pd.DataFrame(boston[‘target‘],columns=[‘target‘])
x_train,x_test,y_train,y_test = train_test_split(x,y,test_size=0.33, random_state=42)

这里我们用网格搜索法进行调参。我们用GridSearchCV,它存在的意义就是自动调参,只要把参数输进去,就能给出最优化的结果和参数。但是这个方法适合于小数据集,一旦数据的量级上去了,很难得出结果。

param = {‘fit_intercept‘:[True,False],‘normalize‘:[True,False],‘copy_X‘:[True,False]}
grid = GridSearchCV(estimator=lr, param_grid=param, cv=5)
grid.fit(x_train,y_train)
print(grid.score(x_test,y_test))

最后得分

0.7258515818230062

原文地址:https://www.cnblogs.com/mambakb/p/10479144.html

时间: 2024-08-30 02:13:11

线性回归预测波士顿房价的相关文章

02-08 多项式回归(波士顿房价预测)

目录 多项式回归(波士顿房价预测) 一.导入模块 二.获取数据 三.训练模型 3.1 报告决定系数 四.可视化 更新.更全的<机器学习>的更新网站,更有python.go.数据结构与算法.爬虫.人工智能教学等着你:https://www.cnblogs.com/nickchen121/ 多项式回归(波士顿房价预测) 一.导入模块 import pandas as pd import numpy as np import matplotlib.pyplot as plt from matplot

C# chart.DataManipulator.FinancialFormula()公式的使用 线性回归预测方法

最近翻阅资料,找到 chart.DataManipulator.FinancialFormula()公式的使用,打开另一扇未曾了解的窗,供大家分享一下. 一 DataManipulator类 运行时,执行数据操作.此类是通过chart中DataManipulator属性对外公开的. 在C#中的继承关系如下: System.Object System.Web.UI.DataVisualization.Charting.DataFormula System.Web.UI.DataVisualizat

02-07 多元线性回归(波士顿房价预测)

目录 多元线性回归(波士顿房价预测) 一.导入模块 二.获取数据 三.训练模型 四.可视化 五.均方误差测试 更新.更全的<机器学习>的更新网站,更有python.go.数据结构与算法.爬虫.人工智能教学等着你:https://www.cnblogs.com/nickchen121/ 多元线性回归(波士顿房价预测) 一.导入模块 import pandas as pd import matplotlib.pyplot as plt from matplotlib.font_manager im

波士顿房价数据集

机器学习:波士顿房价数据集 波士顿房价数据集(Boston House Price Dataset)(下载地址:http://t.cn/RfHTAgY) 使用sklearn.datasets.load_boston即可加载相关数据. from sklearn.datasets import load_boston 该数据集是一个回归问题.每个类的观察值数量是均等的,共有 506 个观察,13 个输入变量和1个输出变量. 每条数据包含房屋以及房屋周围的详细信息. CRIM:城镇人均犯罪率:  ZN

《用Python玩转数据》项目—线性回归分析入门之波士顿房价预测(二)

接上一部分,此篇将用tensorflow建立神经网络,对波士顿房价数据进行简单建模预测. 二.使用tensorflow拟合boston房价datasets 1.数据处理依然利用sklearn来分训练集和测试集. 2.使用一层隐藏层的简单网络,试下来用当前这组超参数收敛较快,准确率也可以. 3.激活函数使用relu来引入非线性因子. 4.原本想使用如下方式来动态更新lr,但是尝试下来效果不明显,就索性不要了. def learning_rate(epoch): if epoch < 200: re

机器学习之路: python 线性回归LinearRegression, 随机参数回归SGDRegressor 预测波士顿房价

python3学习使用api 线性回归,和 随机参数回归 git: https://github.com/linyi0604/MachineLearning 1 from sklearn.datasets import load_boston 2 from sklearn.cross_validation import train_test_split 3 from sklearn.preprocessing import StandardScaler 4 from sklearn.linear

机器学习之路: python 回归树 DecisionTreeRegressor 预测波士顿房价

python3 学习api的使用 git: https://github.com/linyi0604/MachineLearning 代码: 1 from sklearn.datasets import load_boston 2 from sklearn.cross_validation import train_test_split 3 from sklearn.preprocessing import StandardScaler 4 from sklearn.tree import De

波士顿房价处理

1. 导入boston房价数据集 2. 一元线性回归模型,建立一个变量与房价之间的预测模型,并图形化显示. 3. 多元线性回归模型,建立13个变量与房价之间的预测模型,并检测模型好坏,并图形化显示检查结果. 4.  一元多项式回归模型,建立一个变量与房价之间的预测模型,并图形化显示. 1 from sklearn.datasets import load_boston 2 import matplotlib.pyplot as plt 3 from sklearn.linear_model im

SPSS-如何进行多元线性回归预测

http://jingyan.baidu.com/article/4e5b3e1955c89391901e24d0.html 在数据分析行业内,最困难的一项工作就是对未来的某项变化进行预测,以下给各位分享如何利用多元线性回归模型对因变量进行预测: 步骤: 建立预测模型:这里模型为:本例中收集了某地区过去16年的蛾量.卵量.降水量.雨日以及幼虫密度的历史数据,这里蛾量.卵量.降水量和雨日可以统计得到,因此需要这4个自变量来预测因变量幼虫密度,这里建立模型Y=a+x1*b1+x2*b2+x3*b3+