如何通过人工智能“避开”内容安全的“坑”?

10月16日,2018年 AIIA人工智能开发者大会在苏州举办。会议邀请了国内外人工智能产业知名人物、国家政府主管部门、行业内顶尖企业、知名学者代表、开源社区优秀贡献团队及个人,共同交流了技术现状趋势、生态建设经验以及开源社区运营。

网易云易盾CTO朱浩齐

在《AI安全分论坛》,网易云易盾CTO朱浩齐受邀出席,并分享了《人工智能在内容安全的应用实践》主题内容。

随着政策的收紧,“内容安全”成为各大平台、网站的“心病”。2017年以来,因为内容安全问题而被勒令下架、停播、整改的事件相信各位还历历在目。伴随着人工智能的快速发展,以往依靠人工审核的传统方式已经无法满足庞大体量的平台、网站的需求。

那么如何依靠人工智能避开“内容安全”的坑?以下让我们一探究竟。

人工智能技术的初步应用

随着网络强国战略思想、加强网络内容建设等指导思想的推出和强化,内容安全已经成为互联网企业生存和发展的生命线。朱浩齐表示,国家多次强调互联网不是法外之地,利用网络散布×××材料、进行人身***、兜售非法物品等言行要坚决管控,因此绝不能任其大行其道。

然而,传统的内容技术已难以满足企业日益增长的安全需求,就拿图像来说,传统的×××识别技术为例,就经常会存在误判、错判、漏判等情况。

而基于深度学习模型的图像分类,则可以实现更高的准确率,以及图像、内容文本实时处理。实时图像处理的背后是这样的一个技术架构在支撑:下载集群和并行计算,然后再经过×××模型、暴恐模型、涉政模型、广告模型等判断处理,然后给出结果处理。这一套流程下来,平均时长仅在500ms以内。

在文本内容识别上,之前的传统技术存在着各种各样的问题:

变化多:垃圾变种形式多样,内容重复率低;规则系统需要及时维护庞大的规则库才能较好的拦截,人工审核量巨大。

内容短:1~2句话居多,词汇量少;常规的文本分类模型不适用。

多语义:部分敏感词有多重语义;容易误判正常语境下的内容

词序敏感:同样的词在不同词序下会有不同的语义;现有方法无法较好地处理这种问题。


而人工智能技术的应用则可以进行准确实时的文本处理,包括垃圾内容变种智能识别与修正、多意义上下文短文本垃圾检测、Deep Learning垃圾检测等。

具体是:

  • 垃圾内容变种智能识别与修正,能够结合上下文,智能识别同音、拼音、形近、拆字、符号等变形内容。

    通过事先收录的拼音库、形近字库、拆字库、符号库等字典,找出有变种嫌疑的内容,再结合上下文语境信息,使用Machine Learning技术判断是否变种并进行修正。

    汉字有几万个,人工收集形近字耗时耗力,而且不全面。通过算法计算汉字的相似度,快速找出所有的形近字,再进行人工确认,保证精准度。

    同样一个“威”信,一个是“威”信的变种,一个不是,必须结合上下文语境进行判断。

    多意义上下文短文本垃圾检测,使用语义向量的方法识别垃圾语境,再结合垃圾关键词识别短文本垃圾,有效解决词汇量少、多义词等技术难点。


在这部分,基于深度学习模型的图像分类,易盾会使用自主研发的rankDoc算法自动挖掘出不同垃圾类别的数据集。另外,还会在不同垃圾类别的数据集上分别学习词向量模型,利用这些模型,结合机器学习方法在不同垃圾类别数据集上挖掘出每个词对应的上下文信息。

此外在检测时,对包含敏感词的文本会根据上下文信息和人工定制的规则,判断敏感词是否为垃圾语义,并进一步给出全文的检测结果。

检测样例如下所示:

Deep Learning垃圾检测,在语义向量、词性识别等NLP技术的基础上,利用RNN解决词序敏感问题。

易盾对人工智能技术的再优化和探索

但是仅依靠现有的人工智能技术是难以保证百分之百的内容安全的,干扰、特征小、尺度等因素下,昵称、头像、弹幕、打招呼、图床、足迹等等无孔不入的垃圾信息不断侵蚀着内容安全系统。因此,只有不断进化才能在技术层面加强防御实力。

为此,网易云易盾在人工智能技术的定制、算法、工程等方面进行了继续优化。

首先是提供了更为精细粒度的分类模型,筛选内容具体到6大类、20+场景、80+小类,在违规审查上更为严苛。此外,建立了人-物交互检测网络,关注人体有关部位及其附近物体,提取关键线索信息,能够较好地识别出“人-动作-物体”三元组信息。

如上所示,人-物交互检测模型在场景理解上的表现,包括视觉注意力机制(attention)、视觉关系检测(visual relationship detection)以及“人-物”交互检测(human-object interactions)。

通过持续的对抗训练,网易云易盾基于深度学习模型的图像分类技术不仅可以解决微小扰动对于神经网络的欺骗,而且可以对模型上线流程、对抗样本进行准确的稳定性评估。

图片来源:Beyond Adversarial Learning-Data Scaling Attacks in Deep Learning Applications

此外,音频处理也是其中的重要影响因素。图像分类技术能够基于不同的语音场景分类,对语音事件进行检测和识别,并且返回文本进行文本过滤。

基于以上的功能,网易云易盾还做了定制化的模型,根据业务需要,将图像处理分为预处理、模型、策略三阶段。预处理阶段输入图像特征分析或质量分析后,会根据需要进入基础服务阶段或定制服务阶段。模型阶段下,基础分类网络下数据将根据图像全局特征网略、一般网络、局部特征浅层网略进行模型整合和目标检测,定制分类网络则直接进入目标检测。

此外,网易云易盾也在语种识别、处理效率、安全标准提升、审核团队运营等方面不断实现能力提升,包括增加或即将增加藏语、维语、泰语、印度语等语种识别;提升直播、短视频的处理效率;密切配合监管部门,不断完善内容安全标准;并且不断优化审核系统、培养审核团队。

未来

未来,网易云易盾内容安全服务会遵守跨媒体智能、用户行为分析、高度定制化模型的技术路线,致力于实现更为精准高效的服务体系,满足不同企业的业务所需:

跨媒体智能:理解文本、图片、视频、音频的内容后再进行安全分析;
用户行为分析:收集更全面的用户行为数据,配合用户内容数据进行审核过滤;
高度定制化模型:紧贴监管部门政策法规、满足客户实际需求。

“作为网易云旗下的一站式安全服务,网易云易盾坚持提供可靠的内容安全服务。”分享最后,朱浩齐谈到,未来他们将继续认真打磨细节,保持足够的耐心来持续迭代产品,将这种工匠精神发扬光大。此外,“业务仍然重于技术”,技术会进步,业务才是核心。

网易云易盾依托团队20年的技术积累及对网易数十条业务线的保障经验,拥有海量特征库和成熟的安全机制,并结合超强云计算及人工智能技术,形成对游戏、金融、电商、娱乐等场景化解决方案,目前已服务集团内外上千家客户。

点击免费体验网易云易盾内容安全解决方案

原文地址:http://blog.51cto.com/13610827/2300870

时间: 2024-11-13 10:11:28

如何通过人工智能“避开”内容安全的“坑”?的相关文章

活动预告丨易盾CTO朱浩齐将出席2018 AIIA大会,分享《人工智能在内容安全的应用实践》

对于很多人来讲,仿佛昨天才燃起来的人工智能之火,转眼间烧遍了各个角落,如今我们的生活中,处处***着人工智能.10月16日,2018年 AIIA人工智能开发者大会在苏州举办,网易云易盾CTO朱浩齐将出席本次大会『AI安全分论坛』,分享<人工智能在内容安全的应用实践>先来为各位读者介绍一下网易云易盾,网易云易盾诞生于网易杭州研究院,它是网易云旗下一站式安全服务,覆盖内容安全.业务安全.移动安全和网络安全.网易云易盾依托团队20年的技术积累及对网易数十条业务线的保障经验,拥有海量特征库和成熟的安全

您收到一封来自“人工智能+新内容”论坛的邀约,请查收!

致热爱AI技术的你: AI技术正深刻改变着内容行业.从内容生产到内容分发,再到内容营销,内容行业的每一个环节都有AI技术的***:个性化推荐.智能剪辑.机器写作.违规内容处理.聊天机器人--毫不夸张地说,决定内容影响力的因素除了内容本身质量之外,另一个重要因素便是技术. 7月2日,第四范式先荐将于北京西区剧场举办"人工智能+新内容"论坛,届时与业内外诸多人士共同探讨人工智能在内容行业的更多可能. 在内容质量之外,如何从0到1打造中小内容平台的AI技术,如何借助技术完成平台用户.营收及影

给苹果表做 App?先避开这五个坑

自从去年秋天AppleWatch公布以来,苹果就一直在努力地为开发者服务——包括搭建社区并提供抢鲜版的WatchKit SDK.这一切都是为了鼓励开发者为初代AppleWatch制造杀手级应用. 然而,事实证明这并没有什么卵用.目前上架的绝大多数的第三方应用都表现得十分平庸.迟缓和笨重. 有人说这是因为AppleWatch是苹果历史上,从公之于众到正式发售间隔时间最长的一款产品.这逼迫了开发者在没有任何实际使用体验的情况下,只好依靠模拟器去做实验.还有人说,这是因为AppleWatch是一个全新

使用boundingRectWithSize计算内容高度的坑

iOS中,根据给定的内容.字体,宽度,计算文本高度的函数,iOS7之前使用sizeWithFont,iOS7之后使用boundingRectWithSize.</span> - boundingRectWithSize:options:attributes:context: Calculates and returns the bounding rect for the receiver drawn using the given options and display characteris

人工智能(AI)库TensorFlow 踩坑日记之二

上次 踩坑日志之一 遗留的问题终于解决了,所以作者(也就是我)终于有脸出来写第二篇了. 首先还是贴上 卷积算法的示例代码地址 :https://github.com/tensorflow/models   这个库里面主要是一些常用的模型用tensorflow实现之后的代码.其中我用的是 models/tree/master/tutorials/image/cifar10 这个示例,上一篇也大致讲过了. 关于上次遇到问题是: 虽然训练了很多次,但是每次实际去用时都是相同的结果.这个问题主要原因是

如何在人工智能时代避开陷阱 实现落地?

目前人工智能产业规模在不断发展中,可要实现从理论到应用的完美落地,各方企业仍然有相当长的一段路要走.此次事件,便是敲响在人工智能领域的一记警钟.前不久,一直活跃在美国加州大学伯克利分校的网红无人送餐车Kiwibot,被爆出是人工遥控的.据<旧金山纪事报>报道,Kiwi Campus公司承认,Kiwibot之前宣称可以利用人工智能避开行人,自动选择各个地点之间的最短距离等自动化操作,其实都离不开人工的辅助.通过GPS和车载摄像头,操作员每隔五到十秒就向Kiwibot发送指令,妥妥的把人工智能变身

教准备租房的同学如何避开坑!

项目背景: ? 现在是一名大三生,在早早的为实习做准备.一直向往着互联网之都-杭州,实习也准备投往杭州.到了杭州肯定得租房 住,那么许多租房的问题也接踵而至:房租贵.位置偏.房屋旧.房东一言不合就涨租等问题,且也经常听学长抱怨:"早知道 公司附近租房这么贵,当初谈薪资的时候就报个更高的价格了,生活负担更重了".我在想,要是事先知道当前杭州市场租房 价格的合理统计范围或可视化,那就会避免这些问题,减轻自己负担.正是了解到这些情况,所以用自己所学知识来分析了下杭州的租房价格情况~ 项目简介

观点:独立游戏开发者创业路上的11个‘坑’(转)

随着手游市场的快速增长,越来越多的开发者入场,很多有创意的独立开发者在刚进入游戏行业的时候都有非常优秀的创意,但是,从创意到成功的游戏是有距离的,而且在走向成功的路上,会有各种各样的‘坑’,最近,英国的一个独立团队 CEO 就分享了自己遇到过的 11 个‘坑’,以下是 GameLook 编译的内容: 去年 12 月,我应邀去一个活动上做演讲,主要是讲独立开发者们需要避开的 10 个‘坑’.我从来没有想过自己会被冠以‘CEO’的头衔,因为我必须承认的是,我自己过去也是个独立开发者. 在创建 Gif

人工智能之梦

作者:张江 制造出能够像人类一样思考的机器是科学家们最伟大的梦想之中的一个.用智慧的大脑解读智慧必将成为科学发展的终极. 而验证这样的解读的最有效手段,莫过于再造一个智慧大脑--人工智能(Artificial Intelligence,AI). 人们对人工智能的了解恐怕主要来自于好莱坞的科幻片. 这些荧幕上的机器(见图1-1)要么杀人如麻.如<终结者><黑客帝国>.要么小巧可爱,如<机器人瓦利>.要么多愁善感,如<人工智能>:还有一些则大音希声.大象无形.如