奇虎360 HBASE 二级索引的设计与实践

基于RowKey 的索引问题总结

1、索引单一

2、多维度(字段/列)查询困难

  • 多字段分别作为RK,写入多次
  • 组合字段作为RK,设计复杂,不灵活

3、不经过索引的并行scan过滤,大量资源消耗,无时效性可言

总体设计

二级索引构建模式

1)以主数据的列值作为索引数据的RowKey,以主数据的RowKey 作为索引数据的列值,以此来构建指定列作为查询条件的Hbase 二级索引。

2)索引的构建与数据的查询都是分布式、并发式进行的

索引设计

1)索引与主数据存放在同一张表的不同Column Family 中

  • 索引与主数据划分到同一个Region 上,减少RPC 次数,减少网络通信压力
  • 索引与主数据分配在不同的Column Family 中,实现了索引与主数据的物理分离

2)RowKey 格式:RegionStartKey-索引名-索引键-索引值(索引键:主数据列值,索引值:主数据RowKey)

  • RegionStartKey:同一Region 的全体数据按RowKey,自动实现索引与主数据的逻辑分离

写路径

读路径

分裂

索引重建

优化

分享链接

演讲稿下载地址:

http://download.csdn.net/detail/whbsr516/8922067

视频演讲地址:

http://www.infoq.com/cn/presentations/qihoo360-hbase-two-stage-index-design-and-practice

时间: 2024-10-19 11:20:35

奇虎360 HBASE 二级索引的设计与实践的相关文章

HBase二级索引的设计

摘要 最近做的一个项目涉及到了多条件的组合查询,数据存储用的是HBase,恰恰HBase对于这种场景的查询特别不给力,一般HBase的查询都是通过RowKey(要把多条件组合查询的字段都拼接在RowKey中显然不太可能),或者全表扫描再结合过滤器筛选出目标数据(太低效),所以通过设计HBase的二级索引来解决这个问题 查询需求 多个查询条件构成多维度的组合查询,需要根据不同组合查询出符合查询条件的数据 HBase的局限性 HBase本身只提供基于行键和全表扫描的查询,而行键索引单一,对于多维度的

HBase二级索引方案总结

转自:http://blog.sina.com.cn/s/blog_4a1f59bf01018apd.html 附hbase如何创建二级索引以及创建二级索引实例:http://www.aboutyun.com/thread-8857-1-1.html 华为二级索引(原理):http://my.oschina.net/u/923508/blog/413129 在HBase中,表格的Rowkey按照字典排序,Region按照RowKey设置split point进行shard,通过这种方式实现的全局

每天200亿次查询 – MongoDB在奇虎360【转】

100多个应用,1,500多个实例,每天200亿次查询 奇虎是中国最大的安卓移动发布平台.奇虎也是中国最顶尖的病毒软件防护公司,同时为网络以及移动平台提供产品.自从2011年成为MongoDB的用户之后,奇虎已经在MongoDB上构建了100多个不同的应用,其中包括新服务以及从MySQL和Redis上迁移过来的服务——每天都会在MongoDB上运行超过1, 500个实例并且支持200亿次查询. 我很高兴能够有一个机会与奇虎的高级DBA——杨艳杰进行交流,了解更多关于他们使用MongoDB的过程及

hbase二级索引

二级索引与索引Join是多数业务系统要求存储引擎提供的基本特性,RDBMS早已支持,NOSQL阵营也在摸索着符合自身特点的最佳解决方案.这篇文章会以HBase做为对象来讨论如何基于Hbase构建二级索引与实现索引join.文末同时会列出目前已知的包括0.19.3版secondary index, ITHbase, Facebook方案和官方Coprocessor的介绍. 理论目标在HBase中实现二级索引与索引Join需要考虑三个目标:1,高性能的范围检索.2,数据的低冗余(存储所占的数据量).

奇虎360选择IPO “壳概念”很受伤

黄一帆 “市场正呈现出为一幕经典影像:在绚丽的霞光笼罩下,蔚蓝色的大海边,在金色的海岸上,欢笑的孩子们踮起脚尖,刚好看见原来海平面露出的航船桅杆——那是缓缓驶来的注册制号:而转过头来,则是沙滩上大大小小的壳,有的鲜艳,有的朴素,有的饱满光滑,有的干瘪可憎,有的空空荡荡,有的被蟹寄居,动来动去,带着怪异的生机.” 曾为2015年末资本市场写下历史注脚的作者大概不会想到,仅在1年多后,“注册制号”虽然尚未抵达,然而那些曾经遍地的各色怪异“壳”已被慢慢冲刷. 继分众传媒.巨人网络以借壳方式回归A股后,

为什么奇虎360也宣布退市 启动私有化?

继人人.世纪互联等公司宣布私有化后,又一家重量级中概股选择了退市之路.6月17日下午,奇虎360宣布退出美股,启动360私有化战略. 于当天晚七点左右,360公司董事长周鸿祎内部群发邮件证实了这则消息.并表示,对360实施私有化,是在反复考虑当前全球及中国资本市场环境后,为了360未来更好地发展,他和公司总裁齐向东经过审慎思考后做出的主动战略选择. 360公司宣布,公司董事会已接到初步非约束性私有化要约.该要约来自公司董事长周鸿祎.中信证券.华兴资本.红杉资本等,以每股普通股51.33美元(相当

【2015年奇虎360|绿盟科技|唯品会|4399秋招岗位分析及内推】一大波网络|安全|运维岗位来袭~

2015年华为网申截止提醒 ①华为的网申页面:http://career.huawei.com/recruitment/campus.html,之前说明是9月3号截止网申,这两天上去看,发布时间又更新为9月1号,不管怎样,建议大家还是先投递吧.按照拼客科技这边的经验(内部已经有3枚学员入职华为),我们前两年投递的岗位是:技术服务工程师和销售解决方案经理,都是大家学习网络和安全这块的,比较匹配的岗位. ②今年主要是技术服务工程师.网络安全工程师,如果打算走销售方向,也可以投递他们的营销工程师.产品

奇虎360退出美国股市 12月再曝拟私有化

文/辛东方 [摘要]2015年6月,奇虎360董事长周鸿祎宣布启动360私有化战略计划,并退出美国股市,12月再曝与投资者集团达成私有化协议.周鸿祎在股市上到底是赔了,还是赚了,外人不得而知!360到底在卖什么膏药,更是把行业人人士给纠结住了. 据了解,奇虎360是由周鸿祎于2005年9月创立的以主营360杀毒为代表的免费网络安全平台和拥有问答等独立业务的公司.该公司主要依靠在线广告.游戏.互联网和增值业务创收. 2015年6月,奇虎360与投资者集团达成私有化协议,奇虎360的全现金私有化交易

光线凭借《左耳》胜出五一档后,又要拉上奇虎360整大事?

由光线影业出品,苏有朋首度执导的青春题材电影<左耳>,自4月24日上映以来,票房成绩惊人.首周末破两亿,十天破4亿,由欧豪.陈都灵等领衔的鲜肉军团更是让<左耳>成为今年"五一档"最大黑马. 5月10日,<左耳>在实体院线仍保持每天近1000万票房的增势,以"零窗口期"独家超前登陆360网络院线,导演苏有朋以及陈都灵.马思纯.欧豪.胡夏.饶雪漫等主创人员将分别通过创新产品"明星专场"方式与网友.粉丝互动观影. 一