阿里巴巴2016数据挖掘工程师真题在线测

1.想要了解上海市小学生的身高,需要抽取500个样本,这项调查中的样本是?

A.从中抽取的500名学生的身高

B.上海市全部小学生的身高

C.从中抽取的500名小学生

D.上海市全部小学生

2.以下对k-means聚类算法解释正确的是

A.能自动识别类的个数,随即挑选初始点为中心点计算

B.能自动识别类的个数,不是随即挑选初始点为中心点计算

C.不能自动识别类的个数,随即挑选初始点为中心点计算

D.不能自动识别类的个数,不是随即挑选初始点为中心点计算

3.以下哪个是常见的时间序列算法模型

A.RSI

B.MACD

C.ARMA

D.KDJ

4.有个袋子装有2个红球,2个蓝球,1个黄球,取出球以后不再放回,请问取两次出来的球是相同颜色的概率是多少

A.0.3333

B.0.25

C.0.2

D.0.1667

5.65,8,50,15,37,24,()。括号中的数字是()

A.25

B.26

C.22

D.27

6.一组数据,均值>中位数>众数,问这组数据

A.左偏

B.右偏

C.钟型

D.对称

7.SQL语言允许使用通配符进行字符串匹配的操作,其中‘%’可以表示

A.零个字符

B.1个字符

C.多个字符

D.以上都可以

8.关于正态分布,下列说法错误的是:

A.正态分布具有集中性和对称性

B.正态分布的均值和方差能够决定正态分布的位置和形态

C.正态分布的偏度为0,峰度为1

D.标准正态分布的均值为0,方差为1

9.在以下不同的场景中,使用的分析方法不正确的有

A.根据商家最近一年的经营及服务数据,用聚类算法判断出天猫商家在各自主营类目下所属的商家层级

B.根据商家近几年的成交数据,用聚类算法拟合出用户未来一个月可能的消费金额公式

C.用关联规则算法分析出购买了汽车坐垫的买家,是否适合推荐汽车脚垫

D.根据用户最近购买的商品信息,用决策树算法识别出淘宝买家可能是男还是女

10.下列时间序列模型中,哪一个模型可以较好地拟合波动性的分析和预测

A.AR模型

B.MA模型

C.ARMA模型

D.GARCH模型

二、多选题    (共5道题,每题10分)

1.excel工作簿a中有两列id、age,工作簿b中有一列id,需要找到工作薄b中id对应的age,可用的函数包括

A.index+match

B.vlookup

C.hlookup

D.find

2.现在有M个桶,每桶都有N个乒乓球,乒乓球的颜色有K种,并且假设第i个桶第j种颜色的球个数为Cij, 比例为Rij=Cij/N,现在要评估哪个桶的乒乓球颜色纯度最高,下列哪种算法和描述是合理的?

A.∑(1-Rij*Rij)越小越纯

B.∑(1-Rij)*(1-Rij)越小越纯

C.∑(1-Rij)^2 越小越纯

D.-∑Rij*LOG(Rij)越小越纯

3.关于相关系数,下列描述中正确的有:

A.相关系数为0.8时,说明两个变量之间呈正相关关系

B.相关系数等于1相较于相关系数等于-1,前者的相关性更强

C.相关性等于1相较于相关系数等于0,前者的相关性更强

D.Spearman相关系数可以衡量两个定序变量之间的相关程度

4.关于线性回归的描述,以下正确的有:

A.基本假设包括随机干扰项是均值为0,方差为1的标准正态分布

B.基本假设包括随机干扰下是均值为0的同方差正态分布

C.在违背基本假设时,普通最小二乘法估计量不再是最佳线性无偏估计量

D.可以用DW检验残差是否存在序列相关性

5.下列哪些方法可以用来对高维数据进行降维:

A.LASSO

B.主成分分析法

C.小波分析法

D.线性判别法

参考答案和解析可在 阿里巴巴2016数据挖掘工程师真题 答题结束后,个人中心进行查看

时间: 2024-10-31 11:29:54

阿里巴巴2016数据挖掘工程师真题在线测的相关文章

2016年上半年软考真题在线模拟测试,提前知晓你的成绩

2016年上半年软考于5月21日结束了,考试完想知道结果的急切心理,几乎每个经历过上学时代的人都能深刻体验到.如果你想知道你考的怎么样,如果你想要提前知道你的成绩,如果你想知道你哪个地方出错了,如果你想知道你哪个地方知识掌握的不够想要更深入的去理解,那就来希赛软考学院吧!希赛软考学院提供2016年上半年软考真题在线模拟测试,有标准的参考答案,有专业老师的解析视频,让你提前知晓你的成绩,让你再次巩固学习. 希赛授课专家介绍 张友生,计算机应用技术博士,软考培训教程系列丛书主编,考试指定教材<系统分

2019上半年网络工程师真题及答案、刷题

网络工程师2019上半年真题及答案.刷题 1.计算机执行指令的过程中,需要由(1)产生每条指令的操作信号并将信号送往相应的部件进行处理,已完成指定的操作. A.CPU 的控制器 B.CPU 的运算器 C.DMA 控制器 D.Cache 控制器 参考答案[A] 2.DMA 控制方式是在(2)之间直接建立数据通路进行数据的交换处理. A.CPU 与主存 B.CPU 与外设 C.主存与外设 D.外设与外设 参考答案[C] 3.在(3)校验方法中,采用模2 运算来构造校验位. A.水平奇偶 B.垂直奇偶

2016年下半年软考网络工程师真题解析精编版

搜狐2016研发工程师编程题

1.[编程题]马戏团 搜狐员工小王最近利用假期在外地旅游,在某个小镇碰到一个马戏团表演,精彩的表演结束后发现团长正和大伙在帐篷前激烈讨论,小王打听了下了解到, 马戏团正打算出一个新节目“最高罗汉塔”,即马戏团员叠罗汉表演.考虑到安全因素,要求叠罗汉过程中,站在某个人肩上的人应该既比自己矮又比自己瘦,或相等. 团长想要本次节目中的罗汉塔叠的最高,由于人数众多,正在头疼如何安排人员的问题.小王觉得这个问题很简单,于是统计了参与最高罗汉塔表演的所有团员的身高体重,并且很快找到叠最高罗汉塔的人员序列.

阿里巴巴2016研发工程师笔试题

本题实则考察进制转换,可以设为x进制,但是x进制有一个问题,即我们无法对x进制直接进行加减乘除,故转化为我们常见的10进制. 78=7*x+8,123=1*x2+2*x+3:然后解方程即可.答案为13进制. 本题考察的是装箱与拆箱,==比较的是值,同样equals也是比较值.故选择true,true. equals源码如下: public boolean equals(Object obj) { if (obj instanceof Integer) { return value == ((In

2019校招真题在线编程-牛牛找工作

时间限制:2秒 空间限制:65536K 热度指数:77851 本题知识点: 网易 Java工程师 C++工程师 iOS工程师 安卓工程师 运维工程师 前端工程师 算法工程师 PHP工程师 测试工程师 排序 模拟 贪心 题目描述 为了找到自己满意的工作,牛牛收集了每种工作的难度和报酬.牛牛选工作的标准是在难度不超过自身能力值的情况下,牛牛选择报酬最高的工作.在牛牛选定了自己的工作后,牛牛的小伙伴们来找牛牛帮忙选工作,牛牛依然使用自己的标准来帮助小伙伴们.牛牛的小伙伴太多了,于是他只好把这个任务交给

华为2016研发工程师编程题:字符集合

字符集合 输入一个字符串,求出该字符串包含的字符集合 输入描述: 每组数据输入一个字符串,字符串最大长度为100,且只包含字母,不可能为空串,区分大小写. 输出描述: 每组数据一行,按字符串原有的字符顺序,输出字符集合,即重复出现并靠后的字母不输出. 输入例子: abcqweracb 输出例子: abcqwer 解题 标记法时间复杂度太差了,可以用HashMap增加了空间复杂度 我的标记法 import java.util.Scanner; public class Main{ public s

网易2016研发工程师编程题:路灯

路灯 一条长l的笔直的街道上有n个路灯,若这条街的起点为0,终点为l,第i个路灯坐标为ai,每盏灯可以覆盖到的最远距离为d,为了照明需求,所有灯的灯光必须覆盖整条街,但是为了省电,要是这个d最小,请找到这个最小的d. 输入描述: 每组数据第一行两个整数n和l(n大于0小于等于1000,l小于等于1000000000大于0).第二行有n个整数(均大于等于0小于等于l),为每盏灯的坐标,多个路灯可以在同一点. 输出描述: 输出答案,保留两位小数. 输入例子: 7 1515 5 3 7 9 14 0

网易2016研发工程师编程题:扫描透镜

扫描透镜 在N*M的草地上,提莫种了K个蘑菇,蘑菇爆炸的威力极大,兰博不想贸然去闯,而且蘑菇是隐形的.只 有一种叫做扫描透镜的物品可以扫描出隐形的蘑菇,于是他回了一趟战争学院,买了2个扫描透镜,一个 扫描透镜可以扫描出(3*3)方格中所有的蘑菇,然后兰博就可以清理掉一些隐形的蘑菇. 问:兰博最多可以清理多少个蘑菇? 输入描述: 第一行三个整数:N,M,K,(1≤N,M≤20,K≤100),N,M代表了草地的大小; 接下来K行,每行两个整数x,y(1≤x≤N,1≤y≤M).代表(x,y)处提莫种了