2018年,文娱视听行业首先感受到一股监管寒潮,一大批知名泛娱乐产品遭到监管约谈。内容安全成为行业不得不重视的Top问题,视听系统的构建绕不开内容安全,视听行业的从业者也需要越来越关注内容安全。LiveVideoStack邮件采访了国内内容安全领先厂商网易云易盾CTO朱浩齐,分享内容安全的技术现状与未来挑战。
LiveVideoStack:请简单介绍自己和负责的工作?和业界其他厂商相比,有什么特别的故事?
朱浩齐:网易云安全(易盾)是网易云旗下的一站式安全服务,脱胎于网易安全部门。我们在过去20年主要是为网易所有产品提供安全风控支持,覆盖内容安全、移动安全、网络安全和业务安全。
网易云安全和其他安全厂商不同的是,我们一直是业务场景驱动的安全保障,例如内容安全团队就是因为当时网易博客等UGC产品遇到有组织大规模的有害垃圾内容攻击,在网易集团高层的决策下,快速成立的,我们应该是国内第一个大公司中成立这类的团队。我在易盾主要负责云安全服务的技术研发,特别是涉及到智能识别的内容安全和基于大数据的业务安全服务。
LiveVideoStack:据说从网易新闻到网易云音乐的跟帖文化,你都在背后做支撑,能否分享一些你印象深刻的事?或者有趣的事?
朱浩齐:信息技术革命使得社会分工协同越来越紧密,何况在一个公司内部,所以我们作为网易产品的基础安全支持部门,也只是做了我们应该做的事情。但是在帮助产品搭建内容安全体系的时候,确实有很多细节需要相互讨论和理解。比如新闻跟贴,网易有盖楼的特色,但是存在一种可能就是一些楼层有问题,其他没问题,那我们就需要跟产品讨论,让产品增加拆楼的功能,可以把我们认为有问题的楼层都拆掉(删除)。这其实对整个跟贴系统来说是比较大的改动,公司确实投入了较大资源进行架构升级。
此外,云音乐在设计之初就借鉴了跟贴的问题,设计上就不允许多层楼(最多两层)。但是跟云音乐的合作中我们更进了一步,除了有害内容清理之外,我们还尝试做一些“运营需求”的功能:比如对于无意义灌水,破坏社区氛围的谩骂等内容进行识别和清理。结果也还不错,其实网民在网络上也会跟随社区的风气而调整自己的行为。
LiveVideoStack:LiveVideoStack社区的目标在于聚集国内首个专注多媒体视听行业的技术社群,成立来,我们的确验证了业界以及工程师在这个行业的巨大需求,网易云易盾在视听领域有什么特别的洞见?
朱浩齐:我们非常看好视听行业的发展,也看好LiveVideoStack所代表的多媒体视听技术社群的未来。网易在娱乐多媒体方面一直有探索性产品,但易盾是从一个特别的侧面感受到视听行业的爆发。本质上我们的内容安全服务是内容识别,我们目前一天大概识别十亿条信息,成立以来,发现图片、视频、音频所占比例爆发性提升。
我们和服务客户的交流也验证了,内容行业一直朝向更富媒体和社交互动的方向发展,不断为用户拓展新的体验。近两年,产业中凸显出三个趋势:第一是垂直渗透,视听互动正在作为标配功能嵌入到旅游、金融、电商等行业应用。另外,不同媒体形式的交叉融合正在加快,媒体不断增加新的视听内容,音乐应用上线短视频等,泛媒体泛娱乐成为共识。最后,更多媒体形式、更多互动和海量内容也给视听平台带来更大更复杂的内容安全监管压力,内容安全必须走向智能化。
LiveVideoStack:我们的会员很多是视听平台,他们的确也非常关注如何构建高效的内容安全系统?请问有什么建议吗?
朱浩齐:在技术上,尽快采用基于自然语言处理、深度学习技术的智能识别技术改造传统以关键字和特征库为代表的内容识别技术,保证对文字、图片、语音,特别是直播视频的覆盖。在产品上,应该注意内容发布特别是UGC互动接口的覆盖度,除了评论、博客、相册、弹幕等,不能疏漏昵称、头像等签名等角落。在策略上,应该建立对有害信息精细明确的审核体系和应对流程,做好应急响应。
LiveVideoStack:从文字、图像、视频与音频,对于信息的理解难度也在不断加大,能分享一些您和您的团队正在做的技术探索吗?比如NLP,声纹识别的。
朱浩齐:信息理解的难度确实越来越大,但近年来有效的技术手段也在不断更新。一方面我们尝试使用多种技术融合的方式去理解日趋复杂的多媒体内容,例如在图片分析过程中我们会使用多个深度网络结合的方式去提取图片语义信息,同时通过NLP技术对OCR抓取的文字信息进行情感、意义的理解,最后综合图像、文字的理解对信息进行有效判定;另一方面,由于互联网视频内容不断增多,在静态图像处理的基础上,我们使用了视频分析技术更好地对流媒体内容进行解读。此外,声纹识别技术也是安全领域的重要研究课题,我们也在尝试使用端到端的声纹技术去辅助身份认证。
LiveVideoStack:在这么多年的安全从业经历过程中,有哪些乐趣所在?
朱浩齐:安全是一个严肃又严谨的行业,一个小的问题可能都会导致企业严重危机,其实不应该谈什么乐趣吧(对比游戏,社交,电商等领域)。因为很有可能你的乐趣是建立在别人的痛苦之上的(比如研究安全问题会很有意思,了解发生的细节,思考补救的措施,探索新的风险点等等,但那往往是有产品被通报有安全问题了之后发生的)。当然帮助客户解决安全问题带来的成就感是很强的,跟黑产的斗智斗勇也算苦中作乐吧。我们是在解决一些“反人性”的问题,做起来很难,做成了会很开心。
LiveVideoStack:能否简要回顾和展望下安全系统的历史与未来?
朱浩齐:计算机发明之前的信息安全历史主要是密码学范畴,比如加密电报之类的。随着计算机技术的发展,信息安全领域不断扩大,现在已经包含有网络安全,系统安全,移动安全,业务安全,内容安全等等业务了。与此同时,信息安全的威胁也在不断升级,安全事件频发,对安全工作带来的挑战也越来越大。我认为未来也会有一样的发展趋势:安全范围和安全威胁同时增加。
LiveVideoStack:安全部门在企业中的地位往往不高,对于许多管理层而言,安全是成本中心而非利润中心。但安全又无小事,一个小纰漏可能给公司和客户带来巨大的损失。您是如何看待安全这一特殊的行业?有哪些难忘的故事可以分享。
朱浩齐:安全行业门槛比较高,并且确实有吃力不讨好的嫌疑,所以圈子不如其他信息技术行业广大。但是随着安全事件的发生,越来越多的企业领导和政府官员都开始意识到信息安全的重要性了,相关法律法规也不断完善。我认为安全行业的地位随着时间的推移必然会慢慢升高。并且规模化之后安全行业也可以有商业化的探索,既能帮助公司解决安全问题,又可以成为利润来源。
LiveVideoStack:在网易内部,安全算盈利中心吗?是把内部技术开放给了外部对吗?为什么会有这样的举措?
朱浩齐:确切的说,网易内部的安全工作分成了两个部分,一个是为集团服务的基础技术研究工作,一个是商业化安全产品的易盾团队,商业化的部门是盈利中心,它做的就是把网易20年积累的部分内部技术提供给有需要的企业,形成商业化的服务。产生这样的举措我觉得是顺理成章的事情。一方面技术需要落地到更多的场景来证明和保持其先进性,另外一方面把高门槛的安全服务商业化之后能更快的满足安全市场的需求,帮助有需要的企业迅速实现安全体系建设,减少安全风险,提高企业的效率并且减少其成本。
LiveVideoStack:现在各个行业都在谈AI,在安全领域AI应用的现状是什么?业界看好的探索方向是什么?
朱浩齐:其实AI技术很早就有了,只是近年来在新的算法和新的高性能硬件助力下产生的效果有明显进步,在特定范围内甚至可以做到比人更精准高效的结果。目前我们把AI技术应用在内容安全和业务安全领域,使用更好的模型来识别内容和识别风险行为。至于AI探索的方向那太多了,语音识别、翻译、机器人、人脸识别、自动驾驶等等,可以说现在资本投入多的大热方向都是被看好的。
LiveVideoStack:为了更好的分辨正常用户和有威胁的用户,需要对用户做画像分析,与此同时如何保护用户的隐私,您和您的团队做了哪些工作?
朱浩齐:其实做用户画像只需要用户各个维度的数据,但不需要明文数据。对于模型来说只要数据能保持一致性即可。所以我们一方面在部门内部建立了数据保密制度,根据数据重要性等级划分了权限,另外一个方面尽量的把真实的数据做了脱敏处理,比如手机号码,直接哈希成另外一个值即可,无法逆向,人也不能理解,这样数据就算泄露也不会造成隐私泄露的问题。
LiveVideoStack:不久前在西班牙世界通信大会MWC上,5G成为热点。可以预见4K乃至8K视频将在不久的将来普及,这是否会对安全服务带来新的挑战?
朱浩齐:5G的理论速度提升,对于更大更清楚的内容传播肯定会带来好处,不过这对内容安全来说还好,不会有太大的压力。但是5G普及对于接入设备数量的大幅提升,可能会进一步降低黑客的攻击门槛,导致安全成本大幅提升。
娱乐多媒体开发应用实践
随着海量多媒体应用的普及和爆发,用户体验、成本控制以及内容安全等方面也提出了更高的要求。如果你想了解泛娱乐行业的发展趋势与技术难点,5月19日,上海,欢迎来到《娱乐多媒体开发应用实践》专题,与网易云易盾CTO朱浩齐、咪咕视讯技术总监王琦、PP云资深架构师朱明亮、战旗直播流媒体研发工程师石硕面对面,他们将分别从海量与高带宽下的内容安全挑战,5G带来的基于与挑战,高清赛事直播的挑战,以及成本控制与用户体验保障等角度分享多媒体开发最新技术实践与应用案例。
原文地址:http://blog.51cto.com/13610827/2112595