信息流如何规避低质内容和信息茧房?

信息流充斥在我们生活中的每一个角落,如同河流一样哺育着每一个人。我们阅读的每一条新闻、看的每一段视频,一切通过信息流出现在我们眼前的东西,多多少少都受到了智能推荐的驱动。

自2016年开始,信息流几乎进入了所有的头部App。同时各个平台间也开始暗自发力,希望掌握更强大的智能推荐算法。更好的智能推荐体验,意味着更多流量和优质的转化率。那么智能推荐的技术支点究竟在哪?

主动与被动间的认知鸿沟,智能推荐如何才能了解用户?

其实智能推荐的行为逻辑很简单,那就是把适合的内容推荐给适合的用户。但在简单的行为逻辑中的,却是智能推荐的本质:内容和用户两方面的双向深度理解。

首先在对用户的理解上,很多平台都会陷入一个误区,那就是把用户的被动反应当成了主动索求。

比如很多资讯类推荐平台冷启动时,都会让用户选择自己感兴趣的话题,这一行为就已经把用户画像圈定在了平台自己设置的范围之内。实际这种理解用户的方式略有片面,即使不断挖掘也只能察觉到用户在阅读这一个场景中的状态,无法察觉用户在阅读中的喜好、无法察觉用户当下的需求。

这也就形成了信息流最严重的污名——信息茧房,智能推荐只会根据用户的兴趣爱好推荐内容,久而久之用户就会被自己关心的事物围绕,从而失去对外界的整体认知。尤其当低俗、猎奇、软色情这些刺激眼球的信息出现时,人们难免会因为下意识的好奇进行浏览,这一典型的被动反应将相关的标签加入了用户画像中,导致相关内容大量污染用户的信息流。

其实有时候信息茧房的形成并非内容出产者和平台故意灌输带有刺激性的内容给用户,而是一些信息流产品缺少获取用户主动索取行为的途径,犹如将用户放置入一个狭小的环境中,用户对环境产生的一点点反应都会在环境中形成反复的回声。可我们无法确定环境之外用户的主动行为,从而形成了巨大的认知鸿沟。

了解内容才是在大数据外的硬实力

目前很多智能推荐算法了解用户的方式,是利用数据挖掘捕捉用户的每一次点击、浏览行为,对大数据进行汇总、归纳和关联。通过协同过滤算法,寻找用户与用户、内容与内容间的相似点,以此为依据为用户推荐其他内容。这就涉及到了双向深度理解的另一端,也就是对技术硬实力要求最高的内容理解。

和电商、音乐等平台不同,资讯类平台上的内容数量巨大,种类多而庞杂,加之内容本身作为消费品,为了换取流量货币,内容产出者很容易会使用标题党甚至违规内容来吸引点击。

举个例子,当有热门八卦发生时,会有很多作者在标题上提及热门事件蹭热度,内容却与标题毫无关联。或者有作者自己为作品搭上历史、科普等标签,作品中的图片、文字却是软色情内容。这时如果单纯依靠用户间共同喜好做协同过滤推荐,很容易造成推荐不准的情况。

可作为信息流产品,每天由大量作者出产大量内容,只利用人工审核分类是不实际的,利用人工智能技术对内容进行批量理解才是最好的选择。对于图片内容可以建立深度学习模型,用图像识别分辨图片是否涉及违规。对于文字,可以用自然语言处理技术和知识图谱技术实现对内容的理解,分辨是否有文不对题的情况。像Facebook就应用深度学习技术分析了大量标题党标题,建立了专门识别夸张标题的模型来减少标题党状况的存在。

很多资讯类平台都为自己巨大的用户量感到自豪,认为拥有大量用户数据就可以无所不能,实际就是因为用户量巨大,所以很难从用户身上寻找到天然的共同点,需要更强大的技术能力,从用户和内容两方面进行挖掘,进而满足个体用户的深层需求。

资讯推荐谜题,大企业真的有天然优势吗?

如果无法驾驭河流,结果往往是被河水淹没。由于只依赖大数据,缺乏足够的自然语言处理、知识图谱等双向深度理解的技术底牌,在某些推荐算法主导的资讯类平台上体现的最为显著,出现了难以治理低俗内容、推荐不准确等等多种问题。

一个不得不承认的事实是,相比一些业务单一的平台,BAT这类大厂有自身产品群丰富,又有足够的人力和基本投身于人工智能技术建设,更容易做到智能推荐技术的双向深度理解。

以在内容行业扎根很深的百度为例,相比很多内容平台,百度信息流很少受到内容质量方面的诟病。

首先,百度丰富的产品群使得用户画像更加全面,尤其是搜索+信息流双引擎的存在,使得用户的行为更加一致和顺畅。搜索可以有效矫正推荐算法在用户需求分析上的偏差。让用户自己突破信息茧房。

第二点,则是百度自身的AI能力方面的优势,成为了百度信息流最重要的技术底牌。

百度长期做搜索产品,对知识图谱、分词技术有着大量累积,让百度信息流可以更深入的理解文字内容,不仅能理解每一句话在说什么,还能精准的理解内容的感情倾向并为之加上标签。利用知识图谱的深度挖掘和关联能力,构建起科普、娱乐、历史等等细分类别的内容体系,从而实现更精准的内容推荐。

尤其对于图片、短视频这类富媒体内容,图像识别技术就起到了重要作用。当需要对图片内容进行审核和分类时,应用了卷积神经网络的图像识别技术可以快速建立各种模型,实现对丰富的图片内容进行认识和判断,及时找到违规内容并进行处理。

借助于人工智能技术,通过对视频内容的深刻理解和精准分析,百度可以为每一个小视频提炼一个6~10秒的精彩摘要,便于用户快速了解视频内容。基于同样的技术能力,还可以找出短视频所对应的爱奇艺中的长视频。而通过机器学习对视频内容的特征向量进行提取,则为资讯平台中每一段短视频建立了独一无二的视频指纹,不仅仅能实现精准的匹配推荐,还可以保证视频不被盗用,维护了内容创作者的权利。

还有一点,百度有熊掌号、百家号、百度新闻等等多种内容入口,加之百度正在通过“创作大脑”将人工智能技术开放给内容创作者,其中的视频自动转化图文功能、自动识别图片内容并提供相关信息等功能,都在吸引着更多优质内容出产方加入百度内容生态之中,不光媒介结构更加丰满,也给了用户更充实的内容。同时人工编辑的存在也为百度信息流把握着内容价值观的导向,为创作者驱逐劣币,让更多优质内容留存下来。

和其他资讯类平台不同,重金挖角KOL、高额补贴用户和自媒体作者这些事情很少发生在百度信息流产品中。不难看出,当百度整体发展方向扭转向人工智能时,技术优势让百度信息流有能力实现用户和内容双向的深度理解,这是智能推荐背后真正的支点,也是一张全能的王牌。

当智能推荐的信息流已经将我们的生活“包围”,我们或许需要一些时间去习惯。但我们无需抗拒这一事实,当前的些许不适只是科技发展带来的生长痛。

信息流本身就是一种受智能推荐技术驱动的产品,相信各个平台对双向深度理解的追逐不会停止,找对了支点就能将水流引向正确的方向。终有一天信息流不再是信息茧房的代言词,而是如流水一般,哺育着我们对信息的渴求。

原文地址:http://blog.51cto.com/naojiti/2069638

时间: 2024-11-09 08:15:34

信息流如何规避低质内容和信息茧房?的相关文章

推荐系统之信息茧房问题

什么是信息茧房 信息茧房其实是现在社会一个很可怕的现象,从字面意思来看的话其实比喻的是信息被虫茧一般封锁住.这个问题反映了现在随着个性化推荐的普及衍射的一个社会问题. 平时在浏览新闻或者淘宝的时候,平台会自动根据用户的浏览记录获取用户的偏好,然后推送感兴趣的文章.久而久之,比如用户A是个体育迷,那么A获取的信息大多是跟体育相关的,很难获取音乐或者军事等其它相关的资讯,因为平台追求点击率,会一直推送A感兴趣的内容以获取高广告浏览量.时间长了,因为信息茧房的作用,因为信息获取单一,A的社交圈可能也会

读取微软三剑客的内容创建信息

在微软办公套件生成的文件里面(xlsx,docx,pptx文件),存放了文档内容的创建和修改信息(不同于文件创建和修改信息),包括内容创建者.创建时间.最后一次修改的时间和修改人.这些信息可以用文件管理器,右键-详细信息页面能查看到: 那么,我们怎么把这些信息读出来呢? 原理: 2007版以上的三剑客文件,实际上是压缩后的XML文件,这些信息保存在docProps/core.xml中. 该文件的内容大致如下: <?xml version="1.0" encoding="

如何判定伪原创内容之信息指纹技术

"内容为王,外链为皇"这句话,相信任何一个从事SEO工作的人都是知道的,由此可见,内容和外链对于网站的重要性.外链是提升我们网站关键词排名的关键,而内容是我们网站的基础. 站内内容的更新对于网站来说是非常重要的,内容讲究原创性是我们平时在进行内容建设时特别需要注意的地方,但是搜索引擎如何判定原创内容呢?今天徐州亿网将给大家说说搜索引擎的信息指纹技术. 首先给大家说说这个信息指纹技术,接触到这个概念还是在ZAC的一次培训中.信息指纹技术在百度百科中的解释是:就是提取一个信息的特征,通常是

又被BAT“盯上”了,内容创业者的日子还能好过吗?

1月18日举行的百家号年度创作者盛典上,最令内容创业者激动地,或许不是百度推出的智能创作黑科技"创作大脑".也不是"年度创作者"."千寻奖"等大奖.而是针对优质原创视频作者推出的"百万年薪"计划. 百万年薪?是内容分发平台新一轮的"撒币"行动?是百家号作为用户最多的平台,在2018年持续加大分成.技术和流量支持的一个直观注脚? 或许不是给钱那么简单.真相或许是百家号要给优秀创作者更多机会. 趋势一:BAT集

2018申论热点积累(50篇)

1.经济 1.共享经济该听谁的? 共享经济是指利用互联网等现代信息技术整合.分享海量的分散化闲置资源,满足多样化需求的经济活动总和.对于我国而言,发展共享经济适应了“创新.协调.绿色.开放.共享”发展理念的新要求,对实现创新驱动.推进供给侧结构性改革.建设网络强国等具有重要意义.从现实情况看,转型发展的迫切需求.网民大国红利.节俭的传统文化以及企业的成功实践,使共享经济迎来了快速发展的“机会窗口”. 继共享睡眠舱.共享雨伞.共享充电宝等共享模式之后,有高校学生推出共享厨房,某公交站台惊现共享马扎

张小龙做微信公众号APP,对自媒体是祸还是福?

1月15日,2018微信公开课PRO版在广州举行,腾讯高级副总裁.微信创始人张小龙现身现场并发表演讲,他宣布了下一步的微信战略:即将推出微信公众号APP,以及恢复赞赏功能,并倾向于赞赏作者等等.此外,张小龙还表示不会做信息流. 一时之间,人们不禁感慨,微信微信"情怀"不在. 有人问何玺,对张小龙做公众号APP,不做信息流有什么看法?何玺的观点是: 一,内容分发(信息流)是门大生意,腾讯必须卡位 5年完成5轮融资,最新估值达300亿美金.7亿用户,每月净增1000万以上用户.2016年广

从拼产品到拼营销,头条是不是走偏了?

"个性化的信息推荐引擎"今日头条走到今天,"算法"功不可没.但这款以技术取胜的产品,在人民日3评算法之后,正越发的焦虑. 一.头条的焦虑 人们常说,没有一帆风顺的路,人生总要经历坎坷.过去的几年,头条的发展可谓顺风顺水,但随着体量的增加,技术问题.流量问题.政策风险等开始逐渐显现.在各种问题凸显之际,头条开始焦虑起来. 1.技术失控 我们知道,技术算法是头条安家立命的根本. 算法信息流厉害的地方在于它准确命中了用户碎片化时间阅读和兴趣阅读的痛点.但同时这也是它的缺点

张小龙4小时“拖堂”演讲,全面总结微信8年(2019-01-09 转)

大家好!我是张小龙. 刚刚我们在下面看了一下这些吐槽,非常好,因为我每天都在听到这样的声音,都已经习惯了.我觉得在中国来说,每天都有5亿人说我们做得不好,每天还有1亿人想教我怎么样做产品,我觉得这是非常正常的一个事情.但是我来这里不是为了教大家怎么做产品的. 每年我们内部问我要不要参加公开课?我总是说我还没有确定好,我还是要想一想,后来我跟他们提了一个条件,如果我要来的话,能不能把我的时间放到更加晚一点的时间,因为我特别希望我有一个特别好的状态跟大家做交流.后来我用了一个理由说服了我自己,今年我

推荐系统

推荐系统 1.缘起 糖豆作为国内最大的广场舞平台,全网的MAU已经超过4000万,每月PGC和UCG生产的视频个数已经超过15万个,每月用户观看的视频也超过100万个.然而之前糖豆APP首页主要还是依赖内容编辑手工推荐来发现内容,每天的推荐量也是几十个而已.明显可见千人一面的内容分发效率比较低下,继而我们于2016年12月初,启动了糖豆推荐系统的设计以及开发,目前截止到2017年1月初,已经完成第一期推荐系统的开发与评估.推荐项目立项伊始,我撰写了一篇整体架构与设计,本文和架构一文在部分内容有所