网易云易盾CTO朱浩齐:我们是如何用AI赋能内容安全?

欢迎访问网易云社区,了解更多网易技术产品运营经验。

5月19日,LiveVideoStack携手网易云易盾,共同打造了“娱乐多媒体开发应用实践”专题,帮助开发者和泛娱乐平台运营人员,提升技术能力,突破难点,拓展思路与视野。

在专题论坛中,网易云易盾CTO朱浩齐分享了《AI赋能的内容安全技术实践》主题内容,从策略、技术、产品三个方面,详细介绍了网易在内容安全系统构建方面的实践经验,包括如何建立对有害信息精细明确的审核体系和应急响应机制,如何采用基于自然语言、深度学习技术的智能识别技术,保证对文字、图片、语音,特别是直播视频内容的全面精准覆盖等等。

内容安全行业现状:有害信息的持续性递增

2017年全球网民34亿,互联网普及率46%;全球智能手机保有量28亿;2016年互联网占据了中国用户55%的媒体时间;移动互联网使用时长超过电视......这些数字都在表明,网络直播的变现能力已远远超过游戏、电视等其他媒体。

朱浩齐表示,互联网进一步渗透人们生活各个角落的同时,也还带来有害信息的持续性递增——各种违法和不良信息的举报量居高不下,甚至引起了国家战略层面的关注。

没有网络安全,就没有国家安全,更不能让互联网成为传播有害信息、造谣生事的平台。因此,近年来,各种处罚案例也是不胜枚举。

这位网易云易盾CTO列举到:2017年4月18日,北京市网信办、公安局文化场行政执法总队联合约谈今日头条、火山直播、花椒直播;2017年4月底,国家新闻出版广电总局责令腾讯整改微信公众号、移动客户端播放视听节目;2017年6月22日,广电总局责令关停新浪微博、AcFun、凤凰网等站的视频服务;2017年7月,bilibili大量剧集被下架;2018 年4月6日;为了配合广电总局的整改,快手扩容自己内审核团队;2018 年4月8日,广电总局责令今日头条永久关停“内涵段子”等低俗视听产品......可以说,行业进入了强监管时代。

“对于企业来说,内容安全更是成为了刻不容缓的生死命题。”朱浩齐举例称,今年4月,文化部和旅游部公开文件显示已排查4939 款直播应用,下架370款。“所以,多款直播应用平台都选择了加大审核力度和人工投入。”例如,快手发布招聘显示将审核人员规模扩充到5000人,月薪4000-9000元;今日头条也表示近期将扩充到6000人审核团队,预期到达10000人......

朱浩齐认为,互联网直播平台的内容安全给企业带来的挑战远不仅如此,在成本、效果、技术上,各种挑战维度都在不断升级,更是给企业带来了极大的困难。

网易云易盾如何在技术层面提供安全防护?

分享完严峻的形势后,朱浩齐和大家谈了下拥有20年技术沉淀的网易云易盾是如何做内容安全的。

他说,易盾在内容安全上,一共经历了三个阶段:

  • 阶段一:关键词、黑白名单、过滤器;
  • 阶段二:内容特征识别(肤色,纹理)、贝叶斯过滤、相似度匹配、规则系统;
  • 阶段三:大数据分析(用户行为,用户分类)、人机识别、人工智能(语义识别,图像识别、自然语言处理等)。

现阶段文本、图像、语音、视频四块都有哪些核心技术?朱浩齐表示,主要有以下这些:

  • 文本:智能关键词、模糊匹配、语义分析、小语种检测;
  • 图片:图像识别、特征识别、图片检索、OCR 识别;
  • 语音:MD5库检测、语音特征检索、语音特征识别、语音识别;
  • 视频:视频转码压缩、视频流分析、截图/截帧分析。

这位深耕于技术一线的CTO表示,得益于神经网络学科的快速发展,近年来的机器学习技术也在不断进步,为内容安全提供了最坚实的技术保障,包括分层的生物神经网络、图像识别技术、深度神经网络、神经元激活热力图等等,在安全技术效果上给予了更多的强化。

Hubel& Wiesel(图片来源:Harvard Brain)

他说,这些技术也在网易易盾中得到了充分应用,包括图片识别、音频过滤以及视频过滤技术。

  • 图片识别技术:支持人像识别,支持色情图片检测,支持动漫识别;支持相似匹配,支持图片旋转、裁剪,支持改变图片亮度、色调;支持水印识别。
  • 音频过滤技术:基于强大的语音识别分析引擎,通过网易积累多年的垃圾库实时过滤有害语音,同将转成文字进一步过滤。技术要点在于,将语音转换文本和文本检测相结合。
  • 视频过滤技术(直播、点播):视频流检测,视频截图/截帧检测,直播间热度监测,主播黑名单,机器+人工。技术要点在于,将视频转换图片和图片识别技紧密结合。

对于网易来说,内部数据的多样性也给易盾提供了丰富的实践场景。“在网易邮箱、网易新闻、云音乐、LOFTER、云相册、薄荷直播等内部应用构建的数十万变种的数据中,易盾能够实现实时加密过滤垃圾信息、安全防刷等功能,良好地维护了产品运营氛围和用户体验。”

真实的技术环境更为复杂,网易易盾如何更进一步?

事实上,从技术、人力、成本等各维度来看,真实环境中的内容安全防护更为复杂。举例来说,假设10k张图像中有1张是违禁图片,易盾的系统准确率为99.9% ,即1k张图像会判错一张,那么其计算伪阳性率(False Positive Rate,即判断为违禁图像集合中正常样本的比例)为:

即11 张判定为违禁的结果里面竟有10张是误判的——数据的难解释性、黑客的持续性攻击都给内容安全防护提出了更高的要求。

  • 难解释性:如下图所示,一张原本能被正确识别的大熊猫图像,在添加人眼几乎不可辨认的微小变化之后,竟然以99 .3%的置信度被判别为长臂猿。

  • 黑客攻击:通过对输入数据的维度特性进行改变,可以针对深度学习数据处理环节进行攻击,对深度学习图像识别等应用造成逃逸攻击以及数据污染攻击等效果。比如说,下图某位明星,经过数据的维度特性处理后,它能被机器识别为“某本山”。

更遑论,内容安全的“攻击者们”早已形成了成熟的产业链。他们这类徘徊在法律边缘的群体,利益明确且分工协作,攻击手段更是持续升级。所以,对于所有的内容安全厂商来说,这都是一场高成本、长拉锯的攻坚战。

朱浩齐说:“基于此,易盾对比行业传统的内容识别单维度服务,还提供了账号、IP、行为动作(关注,投票,评论)、内容识别、用户画像、群体画像、环境数据、设备指纹的多维度技术服务。此外,更是深入解析攻击漏洞,从注册保护、登录保护、环境监测、行为分析、用户分析、离线计算的全服务流程进行深度的安全防护。”

目前,基于网易所构建的强大用户关系网络,易盾提供了场景化的解决方案。从广告过滤、智能鉴黄、暴恐识别、谣言排查四大方面,实现了弹幕实时过滤、聊天区文本/图片过滤、头像/昵称过滤、直播间电视墙监控、直播间音频过滤、主播黑名单、用户黑名单、房间热度分析等全方位的安全防护功能。此外,“机器+人工”的操作模式,更是从细微之处着手,提供了升级化的技术功能,智能机器监控、优先推送、智能排序、嫌疑高亮、支持警告、断流操作、自动补位、视频大小自适应等等不一而足。

重重的技术防御下,安全效果自然不言而喻。朱浩齐分享到,目前易盾每天为网易数亿的用户和内容数据提供安全保障,也给网易所有得产品提供了全面的信息安全服务。“在今年三月份主要商业网站违法不良信息的举报统计中,易盾全面的信息安全服务为网易的产品带来了效果显著的保护。”他说。

如何快速使用易盾?

网易易盾,是极速智能的内容安全云服务,专注内容安全解决方案。目前,网易易盾已在泛娱乐、多媒体、运营商、电商、金融证券等各行各业实现渗透应用,多领域客户覆盖下,是秉持初心、坚韧不破的安全技术保障。

内容安全数据可视化、智能的直播电视墙、身经百战的审核团队,丰富的功能应用,现在即可获取。

网易云易盾为您提供反垃圾DDoS高防等安全服务,欢迎点击免费试用。

相关文章:
【推荐】 致传统企业朋友:不够痛就别微服务,有坑 (1)

原文地址:https://www.cnblogs.com/zyfd/p/9964203.html

时间: 2024-12-07 06:32:22

网易云易盾CTO朱浩齐:我们是如何用AI赋能内容安全?的相关文章

活动预告丨易盾CTO朱浩齐将出席2018 AIIA大会,分享《人工智能在内容安全的应用实践》

对于很多人来讲,仿佛昨天才燃起来的人工智能之火,转眼间烧遍了各个角落,如今我们的生活中,处处***着人工智能.10月16日,2018年 AIIA人工智能开发者大会在苏州举办,网易云易盾CTO朱浩齐将出席本次大会『AI安全分论坛』,分享<人工智能在内容安全的应用实践>先来为各位读者介绍一下网易云易盾,网易云易盾诞生于网易杭州研究院,它是网易云旗下一站式安全服务,覆盖内容安全.业务安全.移动安全和网络安全.网易云易盾依托团队20年的技术积累及对网易数十条业务线的保障经验,拥有海量特征库和成熟的安全

网易云易盾朱浩齐:视听行业步入强监管和智能时代

2018年,文娱视听行业首先感受到一股监管寒潮,一大批知名泛娱乐产品遭到监管约谈.内容安全成为行业不得不重视的Top问题,视听系统的构建绕不开内容安全,视听行业的从业者也需要越来越关注内容安全.LiveVideoStack邮件采访了国内内容安全领先厂商网易云易盾CTO朱浩齐,分享内容安全的技术现状与未来挑战. LiveVideoStack:请简单介绍自己和负责的工作?和业界其他厂商相比,有什么特别的故事? 朱浩齐:网易云安全(易盾)是网易云旗下的一站式安全服务,脱胎于网易安全部门.我们在过去20

网易云易盾正式成为“中国短视频与直播联盟”常务理事

2018年11月27日,"第六届中国网络视频高峰论坛"在深圳隆重举办.作为内容安全解决方案领域的领先者,网易云易盾凭借其自身在内容安全方面的积累和突出贡献,成为中国短视频及直播联盟常务理事. 中国短视频与直播联盟(China Short Videos and Live Streaming Alliance)是在中国传媒大学的指导下,由中国网络视频研究中心牵头,多家互联网直播和短视频行业的龙头企业联合组成的视频产业联盟.联盟本着资源共享.功能互补.平等互惠.诚信合作的原则,致力于加快直播

网易云易盾亮相2018软博会 政企网站安全监测服务受关注

探寻新时代软件产业发展新路径,聚焦数字经济发展方向,把脉"深度融合"前景,解析人工智能未来发展趋势,6月29日至7月2日,2018软博会在北京盛大召开,多位部委级.省市级等多位领导,两位"两院"院士在大会上发言,七大展区集中展示技术创新最新成果.在第六展区的网易展位,集中展示了网易旗下四个既独具创新又富有社会效益的产品,包括网易卡拉编程.网易人工智能.网易云信和网易云易盾.网易云易盾脱胎于网易安全部,从1999年就开始内部服务网易数十款亿级产品,包括网易新闻.网易云

放心嗨!Android 9 Pie发布,网易云易盾加固已第一时间适配

自5月份谷歌在年度开发者大会上首次亮相Android 9 P后,其正式版Android 9 Pie昨天正式发布,网易云易盾移动安全已在昨天第一时间里进行了最终适配. 早在今年初,易盾就做好了相关的准备工作.在谷歌Android P开发者预览版发布不久后,易盾的安全工程师就完成了加固等方面的测试. 在正式版Android 9 Pie推出前,作为谷歌的合作伙伴,易盾不断与谷歌的工程师紧密沟通,压测可能潜在的问题.同时,易盾积极参与了行业内Android P相关的专项活动,不断完善自己的解决方案. 整

网易云易盾与A10 Networks达成战略合作携手 打造抗DDoS***的解决方案

2018年9月,网易云易盾宣布,与智能和自动化网络安全解决方案提供商A10 Networks结成战略合作伙伴关系.双方将在抗DDoS***领域展开深入合作,共同推出深度集成的联合解决方案,为用户提供从本地防护到云端防护的全方位.无死角的抗DDoS服务闭环. 根据IDC近期发布的<全球DDoS防御产品和服务预测2017-2021>中指出,如今DDoS***格局正发生着巨大的变化,包括***动机的不断变化.***的体量迅速增大.***的种类日渐繁杂等特点.此外,IDC也建议企业不能再依赖于传统的.

网易云易盾中标浙报反作弊服务 助力浙江新闻App健康发展

近日,国内领先的智能业务安全平台网易云易盾和浙报传媒旗下"浙江新闻"达成合作,易盾将为浙江新闻客户端提供大数据反作弊服务,助力浙江新闻抵御刷单.薅羊毛等灰黑产侵害,辅助新闻运营工作健康有序发展,保障广大真实客户的体验和利益. 浙江新闻是浙江日报报业集团推出的第一款移动新闻客户端,正飞速发展为浙江本地政经第一平台.在运营模式上立足本地化,不断探索可视化.互动化.个性化,打造了一系列大数据技术为基础的媒体融合平台,有力促进新闻内容生产.提升新闻内容传播效果.优化新闻客户端发展,也使得用户收

网易云易盾牵手百视通 助力广电领域新媒体内容安全

经过严格的遴选,国内领先的智能内容安全服务商网易云易盾脱颖而出成为百视通BesTV App合作伙伴,携手百视通共同构建纯净健康的内容生态.百事通是中国大陆首家获得IPTV运营牌照的公司,依托上海文化广播影视集团有限公司(SMG),拥有强大的视听内容创意与生产.交互产品研发与应用.新媒体管理与运营的综合优势,在中国IPTV产业中处于领先地位. 作为新媒体视听行业的领军者,以及个性化.时尚化.互动化的新媒体娱乐平台,百事通坚持不断创新,推出交互式聊天新体验的BesTV APP,赋予家庭娱乐更多社交.

网易云易盾推出面向微信小程序的大数据反作弊产品

近日,国内领先的业务风控服务网易云易盾对外推出面向微信小程序的大数据反作弊产品,源于网易20年的核心业务风控技术与全面稳健的策略模型,有机整合了设备指纹.IP画像.规则引擎等八大能力,可广泛应用电商营销.金融支付.生活服务类小程序场景,帮助企业防范微信小程序端的黑灰产作弊侵害. 易盾安全调查显示,小程序已成为企业业务风险环节新缺口 易盾安全经过调查发现,相比App,大部分互联网开发者还没有足够的能力利用小程序的特性建立起有效的风控策略."羊毛党"通过自己养号或着批量购买的大量微信号,就