Poseidon 系统是一个日志搜索平台——认证看链接ppt,本质是索引的倒排列表和原始日志数据都存在HDFS,而文档和倒排的元数据都在NOSQL里,同时针对单个filed都使用了独立索引,使用MR来索引和搜索

 Poseidon 系统是一个日志搜索平台,可以在百万亿条、100PB 大小的日志数据中快速分析和检索。360 公司是一个安全公司,在追踪 APT(高级持续威胁)事件,经常需要在海量的历史日志数据中检索某些信息,例如某个恶意样本在某个时间段内的活动情况。在 Poseidon 系统出现之前,都是写 Map/Reduce 计算任务在 Hadoop 集群中做计算,一次任务所需的计算时间从数小时到数天不等,大大制约了 APT 事件的追踪效率。Poseidon 系统就是解决这个需求,能在数百万亿条规模的数据集中找出我们需要的数据,只需要花费几秒钟时间,大大提高工作效率;同时,数据不需要额外存储,节省了大 量存储和计算资源。该系统可以应用于任何海量(从万亿到千万亿规模)的查询检索需求。

  该系统现已开源:https://github.com/Qihoo360/poseidon 。

  作者介绍

  魏自立,11 年加入 360,高级工程师、资深顾问。参与建设了全世界首个也是目前全世界最大的云查杀安全系统,也是 360 搜索引擎的核心开发。在分布式网络服务器架构与计算、大规模系统性能调优等方面积累了大量实践经验,目前负责 360 核心安全业务线的云引擎服务团队。

  在QCon北京2017上,他还将担任《专题:支撑海量业务的互联网架构》专题的出品人。

  转自:http://mt.sohu.com/it/d20170124/125051471_468650.shtml

时间: 2025-01-09 23:35:05

Poseidon 系统是一个日志搜索平台——认证看链接ppt,本质是索引的倒排列表和原始日志数据都存在HDFS,而文档和倒排的元数据都在NOSQL里,同时针对单个filed都使用了独立索引,使用MR来索引和搜索的相关文章

PDF编辑器让大家都能合并PDF文档 从此不求人

有很多网友对如何将两个PDF文档合并成一个PDF伤透了脑筋,不是在贴吧里求助,就在在问答知乎上提问,今天小编就要化身为解决问题小能手,帮助大家解决这个问题,让大家都能合并PDF文档,从此不求人! 首先,我们需要下载一个非常好用的PDF阅读编辑器,那就是PDF Expert for Mac.(不知道在哪里下载的,小编这里有免费的下载包哦:http://wm.makeding.com/iclk/?zoneid=17779) 下载好之后就将这个PDF阅读编辑器安装好,然后打开如果有PDF Expert

问题:C#打开一个文本文档往里面写数据,没有就新建文档 ;结果:c#FileStream文件读写(转)

FileStream对象表示在磁盘或网络路径上指向文件的流.这个类提供了在文件中读写字节的方法,但经常使用StreamReader或 StreamWriter执行这些功能.这是因为FileStream类操作的是字节和字节数组,而Stream类操作的是字符数据.字符数据易于使用, 但是有些操作,比如随机文件访问(访问文件中间某点的数据),就必须由FileStream对象执行,稍后对此进行介绍. 还有几种方法可以创建FileStream对象.构造函数具有许多不同的重载版本,最简单的构造函数仅仅带有两

集中式日志分析平台 - ELK Stack - 安全解决方案 X-Pack

大数据之心 关注 0.6 2017.02.22 15:36* 字数 2158 阅读 16457评论 7喜欢 9 简介 X-Pack 已经作为 Elastic 公司单独的产品线,前身是 Shield, Watcher, Marvel, Graph, 和 reporting,先来说说这几个爸爸是做什么的吧: Shield: 提供对数据的 Password-Protect,以及加密通信.基于角色的权限控制,IP 过滤,审计,可以有效地: 防止未授权的访问:基于 Password-Protect,基于角

代码搜索平台

http://blog.csdn.net/zhengchun/archive/2009/07/12/4341822.aspx   (转载)图文推荐给开发人员非常实用的站点 我们在开发项目的时候,大多数模块都是逐字逐句敲打出来的,然而随着开源的蓬勃发展,涌现出了好多优秀的开源项目,这些项目不仅能加快开发应用,而且能给我们的开发带来灵感.如果开发人员能灵活应用好这些优秀的开源项目,那也是一笔丰厚的知识财富,下面是笔者整理的一些优秀的网站,相信能对开发人员有所帮助. 代码搜索平台: SourceFor

机房收费系统--需求文档

软件设计都是从需求开始的,需求文档的编写往往就要求调研人员到市场上进行调研,回来后跟开发人员协商讨论而确定的.需求文档旨在详细描述系统使用人员对系统了解的细节,让编程人员认识到代码实现的难易程度,是系统开发人员与用户沟通的桥梁. [描述哪些内容] 1. 为什么要写需求文档,即编写目的-------介绍编写这篇文档的好处,让大家认识到这篇文章的重要性. 2. 对系统的简要介绍,即编写背景,包含项目名称.提出者等有关项目的信息-----直入主题,让读者明确文章主题. 3. 项目的目标.用户特点和约束

机房收费系统个人重构版:透过文档谈文档驱动开发

[背景] 机房收费系统个人重构已接近尾声,在最后阶段自己去补文档以及其中涉及到的图!经过将近一周的奋战将其完善,并最终通过师父的验收.透过这次机房重构写文档和画图,自己感触颇深,在此与大家共享. [文档驱动下软工开发流程] ·软工简介: 从上世纪六十年代的软件危机之后,诞生了软件工程.此后随着人们需求越来越高,导致系统功能复杂度越来越大!要想解开发这样大系统,像之前单个人开发是不可能完成,毫无疑问合作开发就是很好解决方案:但随之而来的是如何控制许多人按照一定的规范在一定时间内将系统按照一定标准完

Aspose.Words:如何添加另一个WORD文档中的Node对象

原文:Aspose.Words:如何添加另一个WORD文档中的Node对象 首先看一段代码,这段代码意图从docSource中获取第一个表格,并插入docTarget的末尾: 1 var table = (Table)docSource.GetChild(NodeType.Table, 0, true); 2 docTarget.FirstSection.Body.ChildNodes.Add(table); 这段代码会抛出异常:“The newChild was created from a

C#如何向word文档插入一个新段落及隐藏段落

向Word文档插入一个新段落的操作步骤 步骤1:新建一个文档并加载现有文档 Document document = new Document(); document.LoadFromFile(@"C:\Users\Administrator\Desktop\向日葵.docx", FileFormat.Docx); 步骤2:插入新段落并设置字体格式 Paragraph paraInserted = document.Sections[0].AddParagraph(); TextRang

CentOS7搭建开源分布式搜索平台ELK实现日志实时搜索并展示图表

    一.简介  Elasticsearch是个基于Lucene实现的开源.分布式.restful的全文本搜索引擎,此外他还是一个分布式实时文档存储,其中每个文档的每个filed均是可被索引的数据,且可被搜索,也是一个带实时分析功能的搜索引擎,能够扩展至数以百计的节点实时处理PB级别的数据.它的特点有:分布式,零配置,自动发现,索引自动分片,索引副本机制,restful风格接口,多数据源,自动搜索负载等.日志主要包括系统日志.应用程序日志和安全日志.系统运维和开发人员可以通过日志了解服务器软硬