阿里云爬虫风险管理产品商业化,为云端流量保驾护航

爬虫风险管理产品是阿里云云盾推出的新安全产品,1月底正式宣布商业化上线,提供可以覆盖Web/H5/API/APP多种业务形态的爬虫风险解决方案,对爬虫风险进行有序管理。

恶意爬虫引发高风险
随着传统行业互联网化及大类业务的数据化,使爬虫风险逐渐成为一个风险爆发点。有网络数据报告统计,目前互联网中超过60%的流量都是批量自动化的爬虫流量。

广义的爬虫并不是仅仅定义为“爬数据”,恶意的黑客利用一些自动化程序“爬虫”来进行业务攻击和欺诈,例如撞库、占座、抢票、刷排名、接口滥用、刷红包等,趋利特征非常明显。常见爬虫主要会集中在类似航空、电商、咨讯、数据、金融、旅行等一些存在高价值数据、原创内容、高获利点的行业中。

恶意爬虫流量往往会引发企业一系列安全问题,并对业务造成一定利益损失,甚至请求量级过大也会同步造成服务器的不可用。

防爬任务困难重重
爬虫中也并不是完全都是恶意爬虫流量,有一部分友好的爬虫,例如搜索引擎爬虫、第三方合作伙伴程序、Robots 协议程序等。安全运维不但要区分出正常人请求和机器爬虫请求,还需要放行友好的爬虫,这会对爬虫识别检测精细度要求较高,并对不同类型的爬虫要有分类和标记。

难点其二在于业务渠道的多样性。行业的互联网化快速发展,尤其是移动端的兴起,一般客户业务中除基础的Web端外,移动端的H5/APP/小程序等也占据较大的业务流量。而爬虫往往攻击的是所有渠道中防护最薄弱及攻击成本最低的业务渠道,会持续在各渠道中切换尝试发现防护短板。如果防护方案比较单一,容易在对抗过程中产品顾此失彼的状态,最终防护失效,仍然造成业务影响。

持续对抗的过程中,爬虫也是会学习进化的,从最初简单自动化脚本会逐步演变成模拟正常用户的访问请求,模拟小区宽带IP,模拟页面浏览停顿操作,模拟正常业务流程路径等等,我们变得越来越难识别恶意爬虫。

难但并不是没有办法。和爬虫的对抗就像一场博弈,我们利用云上生态的优势降低防护成本,提高识别检测的实时性和精准度,逼得爬虫用来伪装的成本高于爬虫的获利时自然会放弃。我们建立独立的检测系统和防护体系,围而不全杀;用AI智能模型识别爬虫,让爬虫难以察觉识别逻辑而减缓变异进度;用人机的验证手段,做第二层的引擎判断,更灵活的对识别结果做处置,进一步减少对正常用户的误报。

爬虫风险如何有序管理
爬虫风险管理产品是一款云盾推出的新安全产品。

产品为SAAS模式,反向代理接入非常轻量和灵活,对七层流量做一次转发,通过云上综合的爬虫防护引擎识别并过滤爬虫流量,帮助客户降低恶意的自动化程序带来的业务影响。干净的业务流量会被继续转发到源站,保证业务正常运行。

产品建设了一整套有层次的爬虫检测模块,主要分为基础防护层、云端情报层、机器学习层,进行信息传递和鉴别,从提供流量上自定义爬虫特征规则工具,到共享云端优势的行业爬虫攻击情报,再到定制贴合客户业务的机器学习算法,逐步递进,快速帮助客户打造一套量身定做的反爬虫策略体系。

产品除了能快速甄别爬虫的行为特征,还可以实现对不同风险等级的爬虫识别结果做不同的处置,合法爬虫做放行,恶意爬虫做阻断,遇到可疑的爬虫去做一个挑战或者校验,多验一次身来做最终判断。

同时,产品内提供了数据可视化模块,从不同维度展示给用户,包括数据和数据之间的关联,让用户参与爬虫特征数据和防护数据之间关系的探索,不断沟通和迭代,不仅清晰地向用户展示爬虫入侵的每一步,也提高了用户反爬虫的策略决策能力。数据模块还集成了阿里云的SLS日志服务,可以查询和定位详细的日志内容,帮助用户了解防护情况和流量细节。

当前产品防护场景主要集中在:

产品优势突出
1、云端部署
云端有技术专家负责产品的规则更新,迅速解决实时风险。
云上资源是可以随时弹性扩容的,针对高峰业务能够自由收缩,帮助客户解决因大促等问题需要扩充机器而带来的成本。
云上的威胁情报资源非常丰富,能够发现针对行业的集中式攻击,并可以将情报应用在行业客户的防御系统中。
2、生态体系
跨多行业的爬虫行为分析,利用关系网络进行恶意爬虫的扩充发现。
爬虫业务目的非常明确,识别行业的集中式攻击,达成行业内共享风险防控。
沉淀网络上黑灰产的百万级已知针对性爬虫风险的IP/UA黑灰产数据。
共享亿级阿里系的设备端的风险情报。

据了解,目前国内外有不少做恶意爬虫流量管理的厂商,侧重点也不尽相同,但阿里云爬虫风险管理产品则是侧重于多层的防护,除了人机识别等检测方式,还会通过行为分析、威胁情报、机器学习算法等方式辅助检测,可以覆盖包括APP在内的各种环境,云上反向代理的方式接入也非常轻量和灵活。

点击了解产品详情
https://www.aliyun.com/product/antibot

点击了解“阿里云新品发布会频道”:
https://promotion.aliyun.com/ntms/act/cloud/product.html

原文链接
更多技术干货 请关注阿里云云栖社区微信号 :yunqiinsight

原文地址:https://www.cnblogs.com/zhaowei121/p/10412712.html

时间: 2024-10-12 16:49:37

阿里云爬虫风险管理产品商业化,为云端流量保驾护航的相关文章

阿里云消息队列Kafka商业化:支持消息无缝迁移到云上

列Kafka彻底解决了开源产品稳定性不足的痛点,可用性达99.9%,数据可靠性99.999999%,并且支持消息无缝迁移到云上. 7月25日,阿里云宣布正式推出消息队列Kafka,全面融合开源生态.在兼容Apache生态的基础上,阿里云消息队列Kafka彻底解决了开源产品稳定性不足的痛点,可用性达99.9%,数据可靠性99.999999%,并且支持消息无缝迁移到云上. Kafka是一个分布式.高吞吐量.高可扩展性的消息队列服务,广泛用于日志收集.监控数据聚合.流式数据处理.在线和离线分析等大数据

阿里云MaxCompute被Forrester评为全球云端数据仓库领导者

摘要: 参考消息网3月19日报道 日前,全球权威调研机构佛瑞斯特研究公司(Forrester)发布<2018年一季度云端数据仓库>报告.报告对大数据服务商的主要功能.区域表现.细分市场和典型客户等进行了全面评估,最终AWS.阿里云.谷歌.微软四大巨头杀入全球一线阵营. 参考消息网3月19日报道 日前,全球权威调研机构佛瑞斯特研究公司(Forrester)发布<2018年一季度云端数据仓库>报告.报告对大数据服务商的主要功能.区域表现.细分市场和典型客户等进行了全面评估,最终AWS.

阿里云OCR证件识别商业化发布,减少人工审核误差节省成本

摘要: 随着互联网的发展,利用现代信息技术开展高效快捷便民服务工作,已经势在必行.证件识别算法,极大地提高了办公效率,现已在互联网金融.银行保险.电信通讯运营商.智能交通.政府.航空.社保局等行业领域被广泛运用. 随着互联网的发展,利用现代信息技术开展高效快捷便民服务工作,已经势在必行.证件识别算法,极大地提高了办公效率,现已在互联网金融.银行保险.电信通讯运营商.智能交通.政府.航空.社保局等行业领域被广泛运用. 近日,阿里云宣布OCR证件识别商业化发布,通过机器人工智能的方式自动识别,减少人

云计算之路-阿里云上:9:55-10:08因流量攻击被进黑洞,造成主站不能正常访问

在宇宙中有黑洞,在阿里云上也有. 9:52-10:08期间,由于遭受大流量的攻击,主站被阿里云云盾打入黑洞,造成主站不能正常访问,给大家带来了很大的麻烦!在这里我们表示深深的歉意,望大家能够谅解! 整个事情发生的过程是这样的: 9:52,收到阿里云的通知短信: [阿里云]尊敬的用户:您的IP正遭受外部流量攻击,已启动云盾DDoS基础防护的免费套餐.当攻击流量超过免费套餐的阈值时,服务器所有访问将被屏蔽.为避免影响云服务器正常使用,请登录官网购买DDoS高防IP服务,轻松解决DDoS攻击困扰. 这

阿里云数据库产品HybridDB简介——OLAP数据库,支持行列混合存储,为用户提供基于开源 OLTP、OLAP、BigData 生态的一站式解决方案

12 月 9 日,阿里云宣布数据库产品 HybridDB 正式商业化. HybridDB(ApsaraDB HybridDB)是一款在线 MPP 大规模并行处理数据仓库的服务.它基于 Pivotal 公司的开源数据库项目 Greenplum Database 开发,并由阿里云数据库团队在云计算架构下深度扩展. 该服务支持了 OSS 存储.JSON 数据类型.HyperLogLog 预估分析等功能特性.通过符合 SQL2008 标准查询语法及 OLAP 分析聚合函数,提供灵活的混合分析能力.提供在

【深圳云栖大会】阿里云弹性计算ESSD云盘产品全面解析

摘要: 2018年3月29日,在深圳云栖大会弹性计算技术专场上,来自阿里云弹性计算产品专家崆闻做了主题为<百万级别IOPS云盘产品全面解析>的技术分享,主要就阿里云新一代ESSD云盘的产品特点.适用业务场景和对业务的实际性能提升进行了深度解读. 2018年3月29日,在深圳云栖大会弹性计算技术专场上,来自阿里云弹性计算产品专家崆闻做了主题为<百万级别IOPS云盘产品全面解析>的技术分享,主要就阿里云新一代ESSD云盘的产品特点.适用业务场景和对业务的实际性能提升进行了深度解读. 阿

像智能手机一样管理云端应用:阿里云联合微软全球首发开放应用模型(OAM)

2019 年 10 月 17 日上午 9 点 15 分,阿里巴巴合伙人.阿里云智能基础产品事业部总经理蒋江伟在 QCon 上海<基于云架构的研发模式演进>主题演讲中,正式宣布: "今天,我们同微软联合发布了一个全新的项目,叫做开放应用模型 Open Application Model(OAM)." 项目主页:https://openappmodel.io 蒋江伟在发布中讲道:"OAM 这个项目是业界第一个云原生应用标准定义与架构模型.我们希望通过这样的架构模型,以

拿下 Gartner 容器产品第一,阿里云打赢云原生关键一战!

作者?| 易立(阿里云容器服务研发总监).伍杏玲 导读:近日,Gartner 发布 2020 年公共云容器报告.据报告显示,阿里云和 AWS 拥有最丰富的产品布局,覆盖 9 项产品能力,并列排名第一.具体详情可查看:<Gartner 容器报告:阿里云与 AWS 并列第一,领先微软.谷歌>. 据 Gartner 分析师评论,阿里云拥有丰富的容器产品形态,在中国市场表现强劲,在 Serverless 容器.服务网格.安全沙箱容器.混合云和边缘等 9 个产品领域具备良好的技术发展策略. 阿里云已连续

【阿里云产品评测】阿里云主机带来不一样的感受

阿里云用户:论坛昵称-安尔宝贝 前言:  我们本身不是专业做网站的,弄弄网站完全是学习和兴趣.使用阿里云之前用过很多主机,虚拟主机也好,VPS也好都有过,并且现在也在多家运营商使用中,所以对主机体验还是能发表一下看法的.多了就不废话了,结合自己跟身边朋友的经验,总而言之,免费的基本不能用,虚拟主机的话如果你只是玩玩的可以考虑几个有长期口碑运营商的产品,如果是要靠网站来吃饭或者忍受不了虚拟主机那种种限制的,绝对要选云主机啦. 为何选阿里云:  之前用过好几个知名运营商,大多数都是不好用的,目前我们