百度 2015 校招北京机器学习/数据挖掘工程师笔试题目（地点：天津大学）

注：凭记忆写的，可能不全，也不一定正确。

一. 简答题

1. new 和 malloc 的区别。

2. hash冲突是指什么？怎么解决？给两种方法，写出过程和优缺点。

3. 命中的概率是 0.25，若要至少命中一次的概率不小于 0.75，则至少需要几次？

二. 算法设计题

1. 用C/C++写一个归并排序。

数据结构为struct Node{int v; Node *next};

接口为 Node * merge_sort(Node *);

2. 设计S型层次遍历树的算法，比如根节点是第一层，第二层从左至右遍历，第三层从右至左遍历，第四层再从左至右遍历，以此类推。

举例：应依次输出 1 2 3 6 5 4 7 8 9。

3. 一个url文件，每行是一个url地址，可能有重复。

（1）统计每个url的频次，设计函数实现实现。

（2）设有10亿url，平均长度是20，现在机器有8G内存，怎么处理，写出思路。

三. 系统设计题

自然语言处理中的中文分词问题，前向最大匹配算法（FMM）。

注：题目举例说明了FMM的基本思想。

（1）设计字典的数据结构 struct dictnote。

（2）用C/C++实现FMM，可选接口为

int FMM(vector<string> iLetters, dictnode *iRoot, vector<int> *oResults);

其中 iLetters 为待分词的句子，比如 {“小”，“明”，“今”，“天”，“买”，“了”，“i”，“p”，“o”，“n”，“e”，“6”}，

iRoot 是字典， oResults 保存输出结果，即分词的位置。也可以自己设计接口。

（3）收集了一些手机品牌的字典，如{iphone, 诺基亚}。

现在要求查找包含这些手机品牌的网页，比如包含 iphone6, 诺基亚 9973 等。

怎么修改FMM实现这个功能，可以写伪代码。

2014年9月20日

时间： 2024-10-15 17:47:04

百度 2015 校招北京机器学习/数据挖掘工程师笔试题目（地点：天津大学）的相关文章

网易机器学习算法工程师笔试编程题

1. 小易为了向他的父母表现他已经长大独立了,他决定搬出去自己居住一段时间.一个人生活增加了许多花费: 小易每天必须吃一个水果并且需要每天支付x元的房屋租金.当前小易手中已经有f个水果和d元钱,小易也能去商店购买一些水果,商店每个水果售卖p元.小易为了表现他独立生活的能力,希望能独立生活的时间越长越好,小易希望你来帮他计算一下他最多能独立生活多少天. 输入描述: 输入包括一行,四个整数x, f, d, p(1 ≤ x,f,d,p ≤ 2 * 10^9),以空格分割输出描述: 输出一个整数, 表

百度2015校招笔试题(头巾问题)

有三个白人被一个印第安人反对部落俘虏了.部落的首领愿意把他们放了,所以他把他们领到一根没有亮光的帐篷里.他给了每人一条头巾(他有5条头巾,3白2红,所以有2条是没有用到的).然后他们排着队出去.这样,每个人都可以看到前面人的头巾颜色,但是看不到自己头巾的颜色(第一个走出去的看不到任何头巾,第二个可以看到第一个人的头巾,第三个人可以看到前面两个人的头巾).如果其中一个人说出了自己头巾的颜色,那么所有人都可以被放了.几分钟的沉默后,其中一个人说:”我头巾的颜色是...”.然后他们就被放了.问题是第几

(转)百度2015年校招笔试

百度2015年校招笔试本文目录: 零.寒暄一.笔试情况二.总结零.寒暄腾讯的笔试结束,也就意味着9月份的战斗告一段落,每天四处奔波,很累也很充实.十一没有出去玩,也拒绝了一些应酬,把一些笔试题整理下,同时也回顾9月份的得失,好好总结,10月再战,告诫自己最难走的路一定是上坡路,坚持坚持! 不多说,看下26号百度的笔试题,我花了两天的时间整理下面的一些内容. 一.笔试情况百度一共是8道题目,2个小时时间,题目不多,总体说来,考的是知识面的广度,开放的题目占多数.本人考的前端岗位.给大家

机器学习&数据挖掘笔记_16（常见面试之机器学习算法思想简单梳理）

http://www.cnblogs.com/tornadomeet/p/3395593.html 机器学习&数据挖掘笔记_16(常见面试之机器学习算法思想简单梳理) 前言: 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考虑该岗位,毕竟在机器智能没达到人类水平之前,机器学习可以作为一种重要手段,而随着科技的不断发展,相信这方面的人才需求也会越来越大.

阿里研究院校招(前端，数据挖掘)社招(Java开发)一起来

1. 校招部分岗位1:数据挖掘工程师(实习生),部门:阿里研究院-数据平台,人数:2人,工作地点:杭州能力要求:熟练运用sql就行.主要是做和政府,消费者,宏观经济等相关的数据挖掘和数据分析. 要求:在校生即可(不限年级),至少每个星期可以来公司待3天的,全职更好.希望近期入职. 团队介绍: 我们致力于打造面向公共服务的数据研究平台,主要服务于政府事务.公共政策.学界等生态伙伴.主要产出包括:1)为宏观经济分析人员和决策制定者提供阿里巴巴宏观经济系列指数:2)为政府事务.宏观区域经济研究提供

2017 校招网上笔试题目

2017 校招网上笔试题目做了一下某大厂的笔试的题目 1. 一个表, visit(cookie_id, area1, area2, date) 给出各种查询策略中, 哪一种最好,每一条SQL语句大同小异, 几乎看不出区别, 还有6,7个选项,同时字数很长.一般的SQL语句好像有根据查询的嵌套顺序来比较差异的,但是这道题反而没有.反正蒙了一个.没有数字可算,心里没有底,应该证明了SQL语法可能会很大地影响查询效率. 2. 给了几个条件,判断你的名次.又是球赛的问题,考查你的推理能力. 3. en

Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱（转）

原文:http://www.52nlp.cn/python-网页爬虫-文本处理-科学计算-机器学习-数据挖掘曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工作中的第一辅助脚本语言,虽然开发语言是C/C++,但平时的很多文本数据处理任务都交给了Python.离开腾讯创业后,第一个作品课程图谱也是选择了Python系的Flask框架,渐渐的将自己的绝大部分工作交给了Python.这些年来,接触和使用了很多Python工具包,特别是在文本处理,科学计算,机器学习和数据挖掘领域,有很多很多

【Python】Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱

好文 mark http://www.52nlp.cn/python-%E7%BD%91%E9%A1%B5%E7%88%AC%E8%99%AB-%E6%96%87%E6%9C%AC%E5%A4%84%E7%90%86-%E7%A7%91%E5%AD%A6%E8%AE%A1%E7%AE%97-%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0-%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98 曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工

JAVA软件工程师笔试试题

JAVA软件工程师笔试试题 (考试时间:120分钟试卷分值:150分 ) 一. 逻辑推理题[10分] 1.甲.乙.丙.丁四位同学中有一位同学为海啸灾区捐款1000元,当老师询问时,他们分别这样回答: 甲:这1000元不是我捐的乙:这1000元是丁捐的丙:这1000元是乙捐的丁:这1000元不是我捐的这四人中只有一个人说了真话,由此可见这1000元是谁捐的( ).[2分] A．甲 B．乙 C．丙 D．丁 2. 甲.乙.丙三人是同一家公司的员工,他们的未婚妻A.B.C也都是这家公司的职员.

百度 2015 校招 北京机器学习/数据挖掘工程师笔试题目（地点：天津大学）

百度 2015 校招 北京机器学习/数据挖掘工程师笔试题目（地点：天津大学）的相关文章

百度 2015 校招北京机器学习/数据挖掘工程师笔试题目（地点：天津大学）

百度 2015 校招北京机器学习/数据挖掘工程师笔试题目（地点：天津大学）的相关文章