从10亿个浮点数当中,选出其中最大的10000个

思路一:

先将数据进行分割成数据量小的一些文件,如1000000个数据为一个文件。

然后将每个文件数据进行排序(用快速排序法排序)

然后使用K路合并法将其合并到一个文件下,取出排序好的最大的10000个数据。

思路二:
1、读一次所有数据,得出最大和最小。
2、用最大和最小,分100个区间。 dx = (x_max - x_min) / 100。—— 每区间范围: dx * (i-1) 到 dx * i,i=1 到 100.
3、读一次所有数据,统计落入各区间的数据个数。
4、从最大区间起,把数据个数依次加起来,找到 正好大于1万个数的区间。
5、如果这个区间的数很多,可以再细分100个区间查找,如数据不太多,则 读一次所有数据,对大小范围在此区间的数排队,找出需要的数。
6、读一次所有数据,把大于此区间上限的数取出来。
5,6 步找到的数据 合在一起 是 1 万个数。

http://blog.csdn.net/laibinghua/article/details/5904636

http://www.cppblog.com/85940806/archive/2011/06/02/147958.html

时间: 2024-09-30 16:12:55

从10亿个浮点数当中,选出其中最大的10000个的相关文章

移动互联网冲击下,分众传媒年增10亿净利,为什么?

2015年底,分众传媒借壳回归A股,与两年前从纳斯达克退市时相比,江南春的身价一跃飙升至536亿元.在分众传媒的发展史上曾一度展开了多项并购,但其中大部分涉及到移动互联网的并购并不都成功,反而是收购的楼宇业务奠定了分众传媒今天的成功. 2016年6月8日,江南春在新投资的移动互联网项目"蓝莓会APP"上线的活动中,说分众传媒2014年赚了24亿净利.2015年为34亿净利.2016年估计将达44亿到46亿净利.这每年十亿净利增长的背后究竟是什么商业逻辑?江南春表示,这反而是因为移动互联

小米与格力的10亿豪赌!

2014年12月12日晚.2013中国经济年度人物评选获奖名单揭晓,小米公司董事长兼首席执行官雷军.格力电器董事长兼总裁董明珠获奖.而在央视主持人陈伟鸿的精彩主持下."柔中强"雷军与"铁娘子"董明珠当着全国人民又下赌注一枚:赌小米5年之内销售额能不能超过格力电器,而且赌资升级至10亿! 2014年12月12日晚.2013中国经济年度人物评选获奖名单揭晓,小米公司董事长兼首席执行官雷军.格力电器董事长兼总裁董明珠获奖.而在央视主持人陈伟鸿的精彩主持下.在"说

“军装照”背后——天天P图如何应对10亿流量的后台承载。

WeTest 导读 天天P图"军装照"活动交出了一份10亿浏览量的答卷,一时间刷屏朋友圈,看到这幕,是不是特别想复制一个如此成功的H5?不过本文不教你如何做一个爆款H5,而是介绍天天P图在"军装照"活动过程中,如何面对10亿流量时的后台承载. 一.10亿浏览量,"军装照"火了 这两天,相信 "军装照"活动已经刷爆了朋友圈,这个活动是由人民日报客户端策划出品并主导开发,腾讯天天P图提供图像处理支持的一款H5产品. 天天P图智能换

锤子不讲情怀傍风口?扯AI虎皮就能值10亿?

提起锤子,相信很多人都是只闻其名不见其机,名字倒是长期处于话题的漩涡之中,而产品却不怎么多见.作为一个超级小众的手机品牌,锤子也算是经历了不少大起大落,过去的2016年是锤子最难熬的一年,亏损.高管离职.资金链断裂等消息不断传出,甚至不少人预测锤子马上就要倒闭. 但现在,濒临死亡的锤子又经历了一次"起死回生".8月6日下午,锤子科技的创始人罗永浩在公开场合上表示:锤子科技已经获得了10亿人民币融资.有了钱的锤子底气就足了,腰杆子也直了,要知道,过去的一年,老罗为了维护锤子的经营,以个人

企业怎样玩转10亿网民?田溯宁有不一样的想法!

京东商城创始人刘强东在中美互联网论坛上表示,中国是世界上最大的互联网市场,未来十年中国网民将超10亿.阿里巴巴创始人马云谈到当前中国传统企业经营压力增大,但更应该看到新经济增长的势头不亚于美国,中国市场潜力巨大.联想CEO杨元庆则提到,现在是一个资源全球配置的时代. 面对一个拥有全球最大网民规模.员工数量动辄上万的企业规模.全球化资源配置以及新经济增长模式层出不穷的转型时代,传统企业究竟要如何实现互联网+.如何玩转即将出现的10亿网民所带来的数据红利和网民人口红利?被誉为中国"互联网建筑师&qu

微信春晚红包的10亿个红包,到底难在哪儿?

4800倍的挑战 今年微信红包方式与去年用户与用户之间互发红包相比,摇红包的方式对业务量来说是一个极大的爆发,光是除夕10:30送出的一波红包就达到了1.2亿个,已经是2014年除夕夜峰值的4800倍之巨(2014年峰值每分钟被拆开红包数量仅2.5W个)!发10亿红包,难在哪里? 微信团队总结下来有三大难点:快——如何保证用户快速摇到红包?准——如何保证摇到的红包能成功拆开?稳——如何保证拆开的红包能分享出去? 大量用户在同一时间摇红包,瞬间产生每秒千万级的请求,这个量级的请求如果不加以疏导处理

怎样从10亿查询词找出出现频率最高的10个

转自:http://dongxicheng.org/big-data/select-ten-from-billions/ 1. 问题描述 在大规模数据处理中,常遇到的一类问题是,在海量数据中找出出现频率最高的前K个数,或者从海量数据中找出最大的前K个数,这类问题通常称为“top K”问题,如:在搜索引擎中,统计搜索最热门的10个查询词:在歌曲库中统计下载率最高的前10首歌等等. 2. 当前解决方案 针对top k类问题,通常比较好的方案是[分治+trie树/hash+小顶堆],即先将数据集按照h

10亿都不赚 YouTube的行业启示录

得屌丝者得天下,几乎成为新的行业成功信条,尤其是在互联网领域多次被证明其威力巨大.但事实上,总会有"例外"出现.在视频行业,别说屌丝,就是能够聚集土豪.极客.宅男.腐女.文艺青年.普通青年等海量视频用户,也没有敢直言自己已经成功的. 视频行业的领头羊,每月用户达10亿的YouTube,在被谷歌"收编"九年后,依然不赚钱--2014 年,YouTube总营收达40亿美元,但尚未贡献盈利.造成这种"勉强维持生存"的原因有多种,其中不少与国内视频行业的

站点公司亚马逊砸了10亿也没能做成智能手机,技术是须要沉淀和积累的

每一个公司都有自己的擅长东西,可是不是都能跨界做成事情的.站点公司亚马逊就是这样,花了10亿元做的手机有一个巨大的销售平台居然也卖不动自己做的手机. Fire Phone的评价也相当的糟糕.说明亚马逊手机没有做好.花钱还做不出好东西. 就像国产操作系统.马云预计砸了10亿也未必能做得好.做出来这个没有问题,做好就不一定easy.做好了还不一定得到用户承认.近期非常多文章给马云yunos泼冷水.说跟魅族合作是僵尸复活等.盛大游戏陈天桥跨界做盛大盒子等都失败了.说明技术是须要积累和沉淀的.不是说掌握