实验10-SPSS-自动线性建模

  •  SPSS自动线性建模

  • 自动线性建模,是在最经常使用的一般线性模型基础上加以改进,让用户输入最少的参数而自动建立线性模型的一个功能。
  • 刚好市场部提供了一个广告效果预测需求,现在市场部已制定了6月1日至7日广告投放计划,希望通过建立线性
  • 回归模型,预测6月1日至7日的购买用户数有多少。我们手中已有1~5月的广告投放效果数据,主要字段有
  • “广告费用”、“广告投放渠道数”、“购买用户数”,就以此需求为例,在SPSS中进行自动线性回归分析。
  • 1.1-实验步骤:
  • (1)SPSS中【分析】-【回归】-【自动线性建模】
  • (2)将“购买用户数”变量,从【预测变量(输入)】框移至【目标】框中,将“日期”变量,从【预测变量(输入)】
  • 框移至【字段】框中。
  • (3)单击【模型选项】卡,勾选【将预测值保存到数据集】复选框。
  • 图1-1 自动线性建模参数设置

  • 1.2 模型结果解读
  • 现在看看输出结果,和其他SPSS输出结果不同,自动线性回归的结果是以可视化报表方式呈现的。
  • 2.1 模型摘要
  • 图 2-1 模型摘要

  • 第一张图为模型摘要,图中用进度条图来展现模型拟合的效果。它类似于普通线性回归中的R^2(决定系数),
  • 一般模型准确度大于70%就算拟合不错,60%以下就需要修正模型,可以通过增加或删除一些自变量后再次
  • 建模进行修正,这个模型准确度达到了94.8%,效果不错。
  • 2.2自动准备数据
  •                                      图 2-2
  • 第二张图是建模的自动准备数据过程信息,比如各个变量的角色,对其进入模型之前都做了哪些处理操作,
  • 常见的预处理就是离群值、缺失值等处理,只有勾选【自动准备数据】复选框,SPSS就会自动进行处理。
  • 2.3 预测变量重要性图
  • 图2-3 预测变量重要性图

  • 第三张图为预测变量重要性图,如图6-7所示,用条形图的方式给出了模型中每个自变量的重要性,按对
  • 因变量影响强度的大小降序排列,重要性是相对值,因此显示的所有自变量的重要性总和为1,其中自变量
  • 的重要性与模型精度无关。
  • 从图中可以看出,“广告费用”变量的重要性最大,而“广告投放渠道数”变量的重要性最小。

  • 2.4 预测-实测散点图
  •                             图2-4 预测-实测散点图
  • 第四张图为预测-实测散点图,也就是预测值和实际因变量值绘制的散点图,横轴为实际因变量值,
  • 纵轴为预测值。它用于考察预测效果,如果效果好,数据点应该是在一条45°线上分布,如图,预测值与实际因变量值较为接近,预测效果好。
  • 2.5 残差图
  • 图2-5 残差图

  • 残差是指实际值与预测值之间的差,残差图用于回归诊断,也就是用来判断当前模型是否满足回归模型的假设:
  • 回归 模型在理想条件下的残差图是 服从正态分布的,也就是说,图中的残差直方图和正态分布曲线是一致的。
  • 如图,残差直方图和正态分布曲线一致,可以得出残差图是接近正态分布的结论,满足回归模型的是假设。
  • 2.6 离群值
  •                                 图 2-6 离群值
  • 第六张图是强影响点(离群值)的诊断,SPSS会计算出库克距离,采用表格的方式输出了强影响点个案ID、因变量及
  • 相应的库克距离,库克距离越大的个案对回归拟合影响的程度越大,此类个案可能会导致模型准确度下降。
  • 2.7 回归效果图
  • 图 2-7 回归效果图

  • 第七张图为回归效果图,用于展现及比较各个自变量对因变量的重要性。每个显著的连续变量均会作为一个模型项,
  • 并对应一条线条,如果有显著的分类变量纳入模型 ,那么模型将分类变量的每一种显著的类别分别作为一个模型项,
  • 并分别对应一条线条。
  • 线条上下顺序是按照自变量的重要性大小降序排列的,由此可以判断各个自变量的重要性。
  • 线条粗细则表示显著性是水平,显著性水平越高其线条越粗。
  • 可以看出,“广告费用”这个自变量对购买用户数的影响最大,重要性为0.97。
  • 2.8 回归系数图
  • 图2-8 回归系数图

  • 图2-8 回归系数表

  • 回归系数图,是这个模型中最重要的一张图,是回归效果图的细化,增加了截距、回归系数等信息,用颜色区分
  • 回归系数的正负,蓝色代表正数,橙色代表负数。同样,线条顺序是按照重要性大小降序排列的,线条粗细表示
  • 回归系数的显著性水平。
  • 通过 回归系数表,我们可以清晰地看到 模型的自变量及对应的回归系数、显著性检验结果、重要性,
  • 每个自变量的显著性水平都小于0.01,说明每个自变量的回归系数具有极其显著的统计学意义。
  • 2.9 均值线图
  • 图 2-9 均值线图

  • 第九张图是因变量与各个自变量绘制的均值,用直观地图形方式帮助我们研究因变量与各个自变量之间的关系。
  • 不显著的自变量不会生成对应的均值线图。如图,“广告费用 ”与“购买用户数”之间存在着明显的线性关系。

  • 2.10 模型构建摘要
  • 图2-10 模型构建摘要表

  • 第十张图为模型构建摘要表,用于输出模型构建过程信息,可以看到模型的信息准则值(AICc)是从左到右依次递减,
  • 数值越小,表示模型效果好,也就是说,随着自变量逐渐被选择进入模型,使得模型拟合效果越来越好。
  • 3. 模型预测
  • 图3-1 数据预测值输出结果

  • 在参数设置中,我们勾选了【将预测值保存到数据集】,SPSS已经在数据集中最后一列增加了一个新变量:预测值。
  • 如图3-1,数据集中最后一列就是预测值,这样就可以根据6月1日至7日广告投放计划,预测得到6月1日至7日
  • 的购买用户数。

来自为知笔记(Wiz)

原文地址:https://www.cnblogs.com/xuxaut-558/p/10285707.html

时间: 2024-11-05 16:04:02

实验10-SPSS-自动线性建模的相关文章

spss自动线性建模

http://www.ibm.com/developerworks/cn/data/library/techarticle/dm-1107yangy/ 一般用户经常会被统计分析软件中的复杂的参数设置而头疼,即使知道了选择合适的模型,也不知道该如何调整参数来进行使用,针对于此,IBM SPSS Statistics 19 加入了一个新的功能:自动化线性建模,这是对最经常使用的线性模型加以改进,让用户输入最少的参数而自动进行建立线性模型的功能,选择菜单:分析 -> 回归 -> 自动线性建模,在目标

Cisco PT模拟实验(10) 路由器的基本配置

Cisco PT模拟实验(10) 路由器的基本配置 实验目的: 掌握路由器几种常用配置方法 熟悉路由器不同的命令行操作模式 掌提路由器的基本配置命令 实验背景: 作为网络管理员,你第一次在设备机房对路由器进行了初次配置后,希望以后在办公室或出差时也可以对设备进行远程管理,现要在路由器上做适当配置. 技术原理: 路由器:一种用于连接因特网中各局域网.广域网,负责分组转发.路由选择的三层网络互联设备.根据信道的情况自动选择和设定路由,以最佳路径,按前后顺序发送信号. 与二层交换机的最大区别,体现在其

机器学习中简易方法----线性建模:最小二乘法

在机器学习中,学习或者推断 属性 变量与相应 响应 变量或 目标 变量之间的 函数 关系,使得对于一个给定的属性(特征)集合,可以进行相应的预测. 例如,建立一个用户对物品的喜好预测模型.已知的数据中有用户信息(年龄,性别等),物品信息(种类,颜色等) ,以及用户对物品的喜好关系(例如 A用户喜好B物品).在给定的用户和物品间(喜好关系未知),希望预测出用户对这个物品的喜好. 在此种情况下,建立一个 关于某个顾客以前买过物品的描述(属性) 和 该顾客最终是否喜好该产品(响应) 的模型.这个模型可

Eureqa Formulize从实验数据中自动筛选函数关系的symbolic regression符号回归软件

各种操作系统,试用30天版本下载:点击打开链接 2009年的时候初次了解这个软件,0.7.7版,以及0.80.2还都是免费的,只是觉得好玩而已: 主要因为Connel大学有人在Science上发了一篇report,介绍了类似symbolic regression概念: 后来一直想找出来,可惜忘记软件名字了,一个关键词也想不起来了:一直找不到: 今天翻旧电脑的老硬盘偶然发现还在一个偏僻的文件夹里:于是找出来了! 留个记号: http://nutonian.wikidot.com/ 现在0.9.9最

实验10(1)

;实验10 ;1.显示字符串 ;表示要用到前面的,8,3数据好麻烦,但是最后还是用了, ;不知道push,pop这么多寄存器干嘛,可能是因为题目要求 ;要保存子程序中要用到的寄存器吧~ assume cs:code,ds:data data segment db 'Welcome to masm!',0 data ends code segment start : mov dh,8 mov dl,3 mov cl,2 mov ax,data mov ds,ax ;定义数据段 mov si,0 m

实验10(2)

;实验10 ;解决除法溢出的问题 assume cs:code , ss:stack stack segment dd 0,0,0,0 stack ends code segment start : mov ax,stack mov ss,ax mov sp,16 ;定义栈段 MOV ax,4240h mov dx,000fh mov cx,0ah call divdw mov ax,4c00h int 21h divdw: push bx MOV bx,ax;保存低位数据 mov ax,dx

Help-IntelliJIDEA-2019-基础设置:10.Maven自动下载源码包,告别反编译,直接上源码注释

ylbtech-Help-IntelliJIDEA-2019-基础设置:10.Maven自动下载源码包,告别反编译,直接上源码注释 1.返回顶部 1. 10.Maven自动下载源码包,告别反编译,直接上源码注释Configure | Settings | Build, Execution, Deployment | Build Tools | Maven | Importing将Automatically Download 的 Source 勾上. 2. 2.返回顶部 3.返回顶部 4.返回顶部

解决windows 10关机自动重启的问题

自从windows 10推出来没多久,就给台式机安装了.可是,有点悲剧的是:每次关机,都会自动重启(restart). 之后也在网上找了一些解决方式,但还是没用.前天通过搜索”Windows 10 cannot be shutdown and restart instead"最终找到一则有效的解决方案. 本解决方案是: 1.进入 Device Manager) 2.选择 Network Adapters 3.选中 网卡,我这里是: Broadcom NetXtreme Gigabit Ether

CISCO PVST+配置和结果验证 per vlan spanning tree(51cto 实验10)

1. 实验线路连接图使用Cisco Packet Tracer6.0 构建拓扑结构图 2. 实验内容(1) 参阅教材中内容,完成PVST+的配置内容.(2) 在各台交换机上使用show spanning-tree vlan 10 和show spanning-tree vlan 20 命令,查看根桥信息.各端口角色和各端口状态.(3) 绘制VLAN10 的生成树图,标明各台Switch 的桥ID.根桥.根端口.指定端口.替代端口以及各个端口的状态.(4) 绘制VLAN20 的生成树图,标明各台S