百度 2015 校招 北京机器学习/数据挖掘工程师笔试题目(地点:天津大学)

注:凭记忆写的,可能不全,也不一定正确。

一. 简答题

1. new 和 malloc 的区别。

2. hash冲突是指什么?怎么解决?给两种方法,写出过程和优缺点。

3. 命中的概率是 0.25,若要至少命中一次的概率不小于 0.75,则至少需要几次?

二. 算法设计题

1. 用C/C++写一个归并排序。

数据结构为struct Node{int v; Node *next};

接口为 Node * merge_sort(Node *);

2. 设计S型层次遍历树的算法,比如根节点是第一层,第二层从左至右遍历,第三层从右至左遍历,第四层再从左至右遍历,以此类推。

举例:应依次输出 1 2 3 6 5 4 7 8 9。

3. 一个url文件,每行是一个url地址,可能有重复。

(1)统计每个url的频次,设计函数实现实现。

(2)设有10亿url,平均长度是20,现在机器有8G内存,怎么处理,写出思路。

三. 系统设计题

自然语言处理中的中文分词问题,前向最大匹配算法(FMM)。

注:题目举例说明了FMM的基本思想。

(1)设计字典的数据结构 struct dictnote。

(2)用C/C++实现FMM,可选接口为

int FMM(vector<string> iLetters, dictnode *iRoot, vector<int> *oResults);

其中 iLetters 为待分词的句子,比如 {“小”,“明”,“今”,“天”,“买”,“了”,“i”,“p”,“o”,“n”,“e”,“6”},

iRoot 是字典, oResults 保存输出结果,即分词的位置。也可以自己设计接口。

(3)收集了一些手机品牌的字典,如{iphone, 诺基亚}。

现在要求查找包含这些手机品牌的网页,比如包含 iphone6, 诺基亚 9973 等。

怎么修改FMM实现这个功能,可以写伪代码。

2014年9月20日

时间: 2024-10-15 17:47:04

百度 2015 校招 北京机器学习/数据挖掘工程师笔试题目(地点:天津大学)的相关文章

网易机器学习算法工程师笔试编程题

1. 小易为了向他的父母表现他已经长大独立了,他决定搬出去自己居住一段时间.一个人生活增加了许多花费: 小易每天必须吃一个水果并且需要每天支付x元的房屋租金.当前小易手中已经有f个水果和d元钱,小易也能去商店购买一些水果,商店每个水果售卖p元.小易为了表现他独立生活的能力,希望能独立生活的时间越长越好,小易希望你来帮他计算一下他最多能独立生活多少天. 输入描述: 输入包括一行,四个整数x, f, d, p(1 ≤ x,f,d,p ≤ 2 * 10^9),以空格分割 输出描述: 输出一个整数, 表

百度2015校招笔试题(头巾问题)

有三个白人被一个印第安人反对部落俘虏了.部落的首领愿意把他们放了,所以他把他们领到一根没有亮光的帐篷里.他给了每人一条头巾(他有5条头巾,3白2红,所以有2条是没有用到的).然后他们排着队出去.这样,每个人都可以看到前面人的头巾颜色,但是看不到自己头巾的颜色(第一个走出去的看不到任何头巾,第二个可以看到第一个人的头巾,第三个人可以看到前面两个人的头巾).如果其中一个人说出了自己头巾的颜色,那么所有人都可以被放了.几分钟的沉默后,其中一个人说:”我头巾的颜色是...”.然后他们就被放了.问题是第几

(转)百度2015年校招笔试

百度2015年校招笔试 本文目录: 零.寒暄 一.笔试情况 二.总结 零.寒暄 腾讯的笔试结束,也就意味着9月份的战斗告一段落,每天四处奔波,很累也很充实.十一没有出去玩,也拒绝了一些应酬,把一些笔试题整理下,同时也回顾9月份的得失,好好总结,10月再战,告诫自己最难走的路一定是上坡路,坚持坚持! 不多说,看下26号百度的笔试题,我花了两天的时间整理下面的一些内容. 一.笔试情况 百度一共是8道题目,2个小时时间,题目不多,总体说来,考的是知识面的广度,开放的题目占多数.本人考的前端岗位.给大家

机器学习&amp;数据挖掘笔记_16(常见面试之机器学习算法思想简单梳理)

http://www.cnblogs.com/tornadomeet/p/3395593.html 机器学习&数据挖掘笔记_16(常见面试之机器学习算法思想简单梳理) 前言: 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考虑该岗位,毕竟在机器智能没达到人类水平之前,机器学习可以作为一种重要手段,而随着科技的不断发展,相信这方面的人才需求也会越来越大.

阿里研究院校招(前端,数据挖掘)社招(Java开发)一起来

1. 校招部分 岗位1:数据挖掘工程师(实习生),部门:阿里研究院-数据平台,人数:2人,工作地点:杭州 能力要求:熟练运用sql就行.主要是做和政府,消费者,宏观经济等相关的数据挖掘和数据分析. 要求:在校生即可(不限年级),至少每个星期可以来公司待3天的,全职更好.希望近期入职. 团队介绍: 我们致力于打造面向公共服务的数据研究平台,主要服务于政府事务.公共政策.学界等生态伙伴.主要产出包括:1)为宏观经济分析人员和决策制定者提供阿里巴巴宏观经济系列指数:2)为政府事务.宏观区域经济研究提供

2017 校招网上笔试题目

2017 校招网上笔试题目 做了一下某大厂的笔试的题目 1. 一个表, visit(cookie_id, area1, area2, date) 给出各种查询策略中, 哪一种最好,每一条SQL语句大同小异, 几乎看不出区别, 还有6,7个选项,同时字数很长.一般的SQL语句好像有根据查询的嵌套顺序来比较差异的,但是这道题反而没有.反正蒙了一个.没有数字可算,心里没有底,应该证明了SQL语法可能会很大地影响查询效率. 2. 给了几个条件,判断你的名次.又是球赛的问题,考查你的推理能力. 3. en

Python 网页爬虫 &amp; 文本处理 &amp; 科学计算 &amp; 机器学习 &amp; 数据挖掘兵器谱(转)

原文:http://www.52nlp.cn/python-网页爬虫-文本处理-科学计算-机器学习-数据挖掘 曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工作中的第一辅助脚本语言,虽然开发语言是C/C++,但平时的很多文本数据处理任务都交给了Python.离开腾讯创业后,第一个作品课程图谱也是选择了Python系的Flask框架,渐渐的将自己的绝大部分工作交给了Python.这些年来,接触和使用了很多Python工具包,特别是在文本处理,科学计算,机器学习和数据挖掘领域,有很多很多

【Python】Python 网页爬虫 &amp; 文本处理 &amp; 科学计算 &amp; 机器学习 &amp; 数据挖掘兵器谱

好文 mark http://www.52nlp.cn/python-%E7%BD%91%E9%A1%B5%E7%88%AC%E8%99%AB-%E6%96%87%E6%9C%AC%E5%A4%84%E7%90%86-%E7%A7%91%E5%AD%A6%E8%AE%A1%E7%AE%97-%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0-%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98 曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工

JAVA软件工程师笔试试题

JAVA软件工程师笔试试题 (考试时间:120分钟 试卷分值:150分 ) 一. 逻辑推理题[10分] 1.甲.乙.丙.丁四位同学中有一位同学为海啸灾区捐款1000元,当老师询问时,他们分别这样回答: 甲:这1000元不是我捐的 乙:这1000元是丁捐的 丙:这1000元是乙捐的 丁:这1000元不是我捐的 这四人中只有一个人说了真话,由此可见这1000元是谁捐的( ).[2分] A.甲 B.乙 C.丙 D.丁 2. 甲.乙.丙三人是同一家公司的员工,他们的未婚妻A.B.C也都是这家公司的职员.