大数据基础--大数据商业应用(刘鹏《大数据》课后习题答案)

1.简述对用户画像的认识。

  用户画像,即用户信息的标签化,是企业通过收集、分析用户数据后,抽象出的一个虚拟用户,可以认为是真实用户的虚拟代表。

2.简述构建用户画像的主要流程。

  基础数据收集->行为建模->构建画像

                                           

3.个性化推荐系统的性能可以通过哪些标准来判定?

  用户满意度  覆盖率  预测准确度  冷启动问题  过度推荐热门问题  个性化推荐

4.简述对广告点击率计算公式的理解。

  指广告展示中被用户点击打开的次数在总展示次数中的比率.

                               

5.影响广告点击率的因素有哪些?

  (1)广告自身的影响 ,广告的类型和广告内容对点击量影响十分显著

  (2)上下文环境影响,网络广告出现的位置极其重要.

  (3)广告浏览者的影响,不同的人群有不同的喜好,这会导致对广告的"偏爱"不同

6.广告点击预估的方法有哪些?

  (1)直接估计法

                   

  (2)点击率预估模型计算方法

7.分别简述基于位置的广告推荐的两种形式。

  (1)“主动式”,也称“推”式,指广告服务提供商根据用户所在位置,主动向客户发送广告,直至用户取消广告订阅或将广告屏蔽为止。

  (2)“被动式”,也称“拉”式,指用户通过关键词发起搜索,推荐系统根据搜索关键词、用户当前位置信息和用户其他特征返回出推荐结果。

8.简述互联网金融的概念。

  互联网金融是指以依托于支付、云计算、社交网络以及搜索引擎等互联网工具,实现资金融通、支付和信息中介等服务的一种新型金融。互联网金融是在实现安全、移动等网络技术水平上,被用户熟悉接受后自然而然为适应新的需求而产生的新模式及新业务。

9.简述大数据在互联网金融中的应用方向。

  (1)金融反欺诈与分析

  (2)构建更全面的信用评价体系

  (3)高频交易和算法交易

  (4)产品和服务的舆情分析

                 

10.简述机器学习在大数据金融中的应用。

  (1)信用评分算法

  (2)分类模型的性能评估

11.简述机器学习在大数据金融中的作用。

                            

12.简述主流的信用评估算法有哪些?

  (1)逻辑回归(Logistic Regression)算法

  (2)支持向量机(SVM)

  (3)决策树(Decision Tree)

  (3)随机森林(Random forest)

  (4)自适应提升(AdaBoost)

  (5)梯度提升决策树(GBDT)

13.简述分类模型的评价体系。 

   (1)混淆矩阵(Confusion Matrix) -> 提升图(Lift),增益图(Gain),受试者工作特征曲线(ROC)。

  (2)受试者工作特征曲线(ROC) -> 曲线下面积(AUC),洛伦兹曲线(KS) -> 基尼系数(GINI)。

  (3)标准误差(MSE)独立出来。

原文地址:https://www.cnblogs.com/lsm-boke/p/11964418.html

时间: 2024-10-17 21:21:59

大数据基础--大数据商业应用(刘鹏《大数据》课后习题答案)的相关文章

电子技术基础模拟部分 第五版 第六版 课后习题答案

<电子技术基础·模拟部分:学习辅导与习题解答(第六版)>是为配合华中科技大学电子技术课程组编.康华光任主编.陈大钦和张林任副主编的<电子技术基础模拟部分> (第六版)教材而编的学习辅导与习题解答. 获取方式见文末 内容包括 一.如何学习模拟电子技术基础(含附录“模拟电子技术基础”课程教学基本要求): 二.各章重点及疑难问题解答:三.各章习题全解. 考虑到SPICE习题需要进行上机仿真验证,为方便读者学习,将分散在主教材各章的SPICE习题集中解答,作为第12章,但习题编号不变. 希

电子技术基础数字部分 第五版 第六版 课后习题答案

电子技术基础模拟部分 第五版 第六版 课后习题答案 <电子技术基础·模拟部分:学习辅导与习题解答(第六版)>是为配合华中科技大学电子技术课程组编.康华光任主编.陈大钦和张林任副主编的<电子技术基础模拟部分> (第六版)教材而编的学习辅导与习题解答. 获取方式见文末 全书共11章,分别是:数字逻辑概论,逻辑代数与硬件描述语言基础,逻辑门电路,组合逻辑电路,锁存器和触发器,时序逻辑电路,半导体存储器,CPLD和FPGA,脉冲波形的变换与产生,数模与模数转换器,数字系统设计基础. 扫一扫

大数据基础--大数据可视化(刘鹏《大数据》课后习题答案)

1.数据可视化有哪些基本特征? (1)易懂性,可视化可以使碎片化的数据转换成具有特定结构的知识,从而为决策支持提供帮助. (2)必然性,大数据所产生的数据量必然要求人们对数据进行归纳总结,对数据的结构和形式进行转换处理. (3)片面性,数据可视化的片面性特征要求可视化模式不能替代数据本身,只能作为数据表达的一种特定形式. (4)专业性,专业化特征是人们从可视化模型中提取专业知识的环节,它是数据可视化应用的最后流程. 2.简述可视化技术支持计算机辅助数据认识的3个基本阶段. (1)数据表达,数据表

大数据基础--R语言(刘鹏《大数据》课后习题答案)

1.R语言是解释性语言还是编译性语言?   解释性语言 2.简述R语言的基本功能.   R语言是一套完整的数据处理.计算和制图软件系统,主要包括以下功能: (1)数据存储和处理功能,丰富的数据读取与存储能力,丰富的数据处理功能. (2)数组运算工具 (3)完整连贯的统计分析工具 (4)优秀的统计制图功能 3.R语言通常用在哪些领域?   人工智能.统计分析.应用数学.计量经济.金融分析.财经分析.生物信息学.数据可视化与数据挖掘等. 4.R语言常用的分类和预测算法有哪些?   (1)K-近邻算法

大数据基础--互联网大数据处理(刘鹏《大数据》课后习题答案)

1.简述互联网信息抓取的方式. 互联网信息自动抓取,最常见且有效的方式是使用网络爬虫. 2.简述舆情系统的组成架构. 用户终端->采集层->分析层->呈现层->用户 3.中文分词算法可以分为哪几类? (1)基于字符串匹配的分词方法,它是待处理的中文字符串与一个“尽可能全面”的词典中的词条按照一定的规则进行匹配,若某字符串存在于词典中,则认为该字符串匹配成功. (2)基于统计的分词方法,由于词是特定的字组合方式,那么在上下文中,相邻的单字共同出现的频率越高,则在该种字组合方式下就越有

CSDN专访:大数据时代下的商业存储

原文地址:http://www.csdn.net/article/2014-06-03/2820044-cloud-emc-hadoop 摘要:EMC公司作为全球信息存储及管理产品方面的领先公司,不久前,EMC宣布收购DSSD加强和巩固了其在行业内的领导地位,日前我们有幸采访到EMC中国的张安站,他就大数据.商业存储.Spark等给大家分享了自己的看法. 谈到大数据,张安站认为大数据本质上是两个根本性的问题,一个是数据很大,如何存储?另外一个是数据很大,如何分析?第一个问题,对于存储厂商来说,就

“大数据“基础知识普及

大数据,官方定义是指那些数据量特别大.数据类别特别复杂的数据集,这种数据集无法用传统的数据库进行存储,管理和处理.大数据的主要特点为数据量大(Volume),数据类别复杂(Variety),数据处理速度快(Velocity)和数据真实性高(Veracity),合起来被称为4V. 大数据中的数据量非常巨大,达到了PB级别.而且这庞大的数据之中,不仅仅包括结构化数据(如数字.符号等数据),还包括非结构化数据(如文本.图像.声音.视频等数据).这使得大数据的存储,管理和处理很难利用传统的关系型数据库去

大数据基础篇(一):联机分析处理(OLAP) 与 联机事务处理(OLTP)

联机事务处理(OLTP) OLTP也称实时系统(Real Time System),支持事务快速响应和大并发,这类系统典型的有ATM机(Automated Teller Machine)系统.自动售票系统等,但有些银行转账并不是实时到账的.OLTP反映企业当前的运行状态,完成企业管理所包含的日常任务的数据库应用,一般没有复杂的查询和分析处理. 联机分析处理(OLAP) OLAP也称决策支持系统(Decision Support System,DSS),是数据仓库系统的主要应用形式,使分析人员.管

区块链这些技术与h5房卡斗牛平台出售,大数据基础软件干货不容错过

在IT产业发展中,包括CPU.操作系统h5房卡斗牛平台出售 官网:h5.super-mans.com 企娥:2012035031 vx和tel:17061863513 h5房卡斗牛平台出售在内的基础软硬件地位独特,不但让美国赢得了产业发展的先机,成就了产业巨头,而且因为技术.标准和生态形成的壁垒,主宰了整个产业的发展.错失这几十年的发展机遇,对于企业和国家都是痛心的. 当大数据迎面而来,并有望成就一个巨大的应用和产业机会时,企业和国家都虎视眈眈,不想错再失这一难得的机遇.与传统的IT产业一样,大