要做的题目-要用到hadoop资源

关于项目,我出两个练手题目:

一、多机数据处理。有 10 台机器,每台机器上保存着 10 亿个 64-bit 整数(不一定刚好 10 亿个,可能有上下几千万的浮动),一共约 100 亿个整数(其实一共也就 80GB 数据,不算大,选这个量级是考虑了 VPS 虚拟机的容量,便于实验)。编程求出:

1. 这些数的平均数。

2. 这些数的中位数。

3. 出现次数最多的 100 万个数。

*4. (附加题)对这 100 亿个整数排序,结果顺序存放到这 10 台机器上。

*5. (附加健壮性要求)你的程序应该能正确应对输入数据的各种分布(均匀、正态、Zipf)。

*6. (附加伸缩性要求)你的程序应该能平滑扩展到更多的机器,支持更大的数据量。比如 20 台机器、一共 200 亿个整数,或者 50 台机器、一共 500 亿个整数。

二、N-皇后问题的多机并行求解。利用多台机器求出 N-皇后问题有多少个解。(注意目前的世界纪录是 N = 26,A000170 - OEIS )

1. 8 皇后问题在单机上的运算时间是毫秒级,有 92 个解,编程实现之。

2. 研究 N-皇后问题的并行算法,写一个单机多线程程序,争取达到线性加速比(以 CPU 核数计)。再设法将算法扩展到多机并行。

3. 用 10 台 8 核的机器(一共 80 个 CPU cores),求解 19-皇后和 20-皇后问题,看看分别需要多少运行时间。你的方案能否平滑扩展到更多的机器?

*4. (附加题)如果这 10 台机器的型号不一,有 8 核也有 16 核,有旧 CPU也有更快的新 CPU,你该采用何种负载均衡策略,以求缩短求解问题的时间(至少比 plain round-robin 算法要好)?

其他内容,详见以下文章:

http://fpcfjf.blog.163.com/blog/static/55469793201681811258259/

(转载)陈硕对新的人建议

时间: 2024-10-10 09:19:48

要做的题目-要用到hadoop资源的相关文章

不用加减乘除来做加法的题目

题目:实现int add(int a, int b)方法,实现a和b的和,但是内部不允许使用+-*/等算术运算. 解答:这个题考查的其实是对计算机硬件如何做加法的.计算机内做加法和乘法都是模拟人做加法和乘法的方法来设计和实现cpu算术运算模块的.这在我们学习计算机组成原理的课程时应该学到过.如下面例子: 1101 11 + -------------- 10000 这个计算可以分为两部分,一部分是按位+的过程,另一部分是进位的过程. 按位+,其实就是异或运算了,1+1=0,进1位,0+1=1+0

做css题目遇到的问

19.$("div#intro .head") 选择器选取哪些元素? 您的回答:id="intro" 的首个 div 元素中的 class="head" 的所有元素 20.jQuery 是 W3C 标准吗? 您的回答:Yes 正确答案:No 2.jQuery 使用 CSS 选择器来选取元素? 您的回答:错误 正确答案:正确 7.jQuery html() 方法适用于 HTML 和 XML 文档. 您的回答:正确 正确答案:错误 12.下面哪个 j

php做投票题目

1. 做一个类DBDA 把数据库内容封装进去 <?php class DBDA{ public $host="localhost"; //服务器地址 public $uid="root"; //用户名 public $pwd="5270437"; //密码 public $dbname="ceshi"; //数据库名称 /* 执行一条SQL语句的方法 @param sql 要执行的SQL语句 @param type SQ

打算要做的题目

真的,好想变强.于是......... 刷题吧. 小目标,一个月内做完吧: https://vjudge.net/contest/66569#overview https://vjudge.net/contest/66964#overview https://vjudge.net/contest/66965#overview https://link.zhihu.com/?target=http%3A//vjudge.net/contest/68966%23overview https://vj

挖坑贴——2014年结束前要做的题目们

2014/10/26: BZOJ2752 [HAOI2012]高速公路(road)  --线段树,操作太烦了的说... BZOJ1020 [SHOI2008]安全的航线flight  --二逼计算几何T T BZOJ1013 [JSOI2008]球形空间产生器sphere  --貌似是高斯消元? BZOJ1033 [ZJOI2008]杀蚂蚁antbuster  --大家程序都写了300行+我去><

hihocoder #1039 : 字符消除 ( 字符串处理类 ) 好久之前做的题目,具体的算法代码中阅读吧

#1039 : 字符消除 时间限制:1000ms 单点时限:1000ms 内存限制:256MB 描述 小Hi最近在玩一个字符消除游戏.给定一个只包含大写字母"ABC"的字符串s,消除过程是如下进行的: 1)如果s包含长度超过1的由相同字母组成的子串,那么这些子串会被同时消除,余下的子串拼成新的字符串.例如"ABCCBCCCAA"中"CC","CCC"和"AA"会被同时消除,余下"AB"和

剑指Offer - 后面再做的题目

https://www.nowcoder.com/practice/96bd6684e04a44eb80e6a68efc0ec6c5?tpId=13&tqId=11188&tPage=3&rp=3&ru=/ta/coding-interviews&qru=/ta/coding-interviews/question-ranking 数组中的逆序对 https://www.cnblogs.com/coffy/p/5896541.html https://www.now

Hadoop资源分享

Hadoop技术内幕:深入解析MapReduce架构设计与实现原理http://yunpan.cn/cwBBhLYTBnVRG (提取码:1810)

Ganglia+nagios 监控hadoop资源与报警

全篇主要依赖下面2篇文章 http://quenlang.blog.51cto.com/4813803/1571635 http://www.cnblogs.com/mchina/archive/2013/02/20/2883404.html#!comments 一 资源下载 ganglia-3.6.0.tar.gz ganglia-web-3.6.2.tar.gz nagios : http://sourceforge.net/projects/nagios/files/nagios-4.x/