京东商城背后的AI技术能力揭秘 - 基于关键词自动生成摘要

作者:京东AI研究院

导言

过去几十年间,人类的计算能力获得了巨大提升;随着数据不断积累,算法日益先进,我们已经步入了人工智能时代。确实,人工智能概念很难理解,技术更是了不起,背后的数据和算法非常庞大复杂。很多人都在疑惑,现在或未来AI将会有哪些实际应用呢?

其实,关于AI的实际应用以及所带来的商业价值并没有那么的“玄幻”,很多时候就已经在我们的身边。接下来,【AI论文解读】专栏将会通过相关AI论文的解读,由深入浅地为大家揭秘,AI技术是如何对电商领域进行赋能,以及相关的落地与实践。人工智能技术在电商领域,有着丰富的应用场景。应用场景是数据入口,数据通过技术得到提炼,反过来又作用于技术,二者相辅相成。

京东基于自然语言理解与知识图谱技术,开发了商品营销内容AI写作服务。并将此项技术应用到了京东商城【发现好货】频道中。

通过AI创作的数十万商品营销图文素材,不仅填补了商品更新与达人写作内容更新之间的巨大缺口,也提升了内容频道的内容丰富性。

同时,AI生成内容在曝光点击率、进商详转化率等方面其实都表现出了优于人工创作营销的内容。

接下来让我们一起来看看,针对不同群体采用不同营销策略及不同风格的营销文案从而提高营销转化率是怎样通过AI来实现的。



与传统的文本摘要任务相比,商品摘要任务更具挑战性。一方面,商品给顾客的第一印象来自该商品的外观,这对顾客的购买决策有着至关重要的影响。因此,商品摘要系统必须能够充分挖掘商品视觉信息,反映商品的外观特色。另一方面,不同的产品有不同的卖点。例如,紧凑型冰箱的优点是节省空间,而环保型冰箱的优点是节能。因此,商品摘要应该反映商品最独特的方面,从而最大限度地促成消费者的购买。

本文接下来将介绍由京东 AI 研究院提出的一种电商商品的多模态摘要模型,该模型可以有效地整合商品的视觉和文本信息来生成卖点突出、流畅和简洁的商品文本摘要。

论文的标题为 :Aspect-Aware Multimodal Summarization for Chinese E-Commerce Products ,发表于 AAAI 2020。

论文链接:http://box.jd.com/sharedInfo/2926429040ECC7D3

如下图1所示,商品广告含有大量的文字介绍,顾客很难在短时间内在这些广告中获取有价值的商品信息,尤其是当顾客想要比较多个商品时,将会耗费大量的时间,影响了购物体验。商品摘要模型可以为商品生成文本摘要,为潜在消费者提供了短时间内了解商品的便利。从消费者决策的角度出发,一个好的商品摘要需要反映商品的外观特色和卖点信息,这也是本文提出的商品摘要模型的出发点。

图1

论文提出了一种基于商品要素的多模态商品摘要方法,如图1所示,该模型将商品图像、产品标题和其他产品描述作为输入,生成商品文本摘要。该模型不仅可以有效地整合商品的视觉和文本信息,而且从商品要素出发,使生成的商品摘要尽可能的包含商品的特色要素,并提高商品摘要的流畅性和简洁性。

论文中构建了一个中文商品摘要数据集,该数据集包含约140万个“商品-摘要”对,涵盖家电、服饰和箱包品类。在该数据集上的实验结果表明,文中提出的模型在自动评价和人工评价指标上都显著优于其他对比方法。

如图2所示,论文中提出的商品摘要模型基于指针-生成器网络(Pointer-Generator)。采用了三种策略将商品图像信息融入模型中,包括使用商品图片的全局特征初始化编码器,使用商品图片的全局特征初始化解码器,以及使用商品图片的局部特征,通过注意力机制生成图片上下文向量参与解码。

图2

首先,对商品要素进行建模(所谓的商品要素,就是商品不同方面的属性。例如:对洗衣机而言,商品要素包括容量和能耗等),然后从商品的要素出发,对摘要的重要性、非冗余性和可读性进行建模。

(1)采用基于商品要素的RAML(reward augmented maximum likelihood)训练,鼓励模型生成的摘要涵盖商品的特色要素。如图2(b)所示,该商品ground-truth特色要素是容量、操控与电机,则该模型将会鼓励生成描述容量、操控与电机相关的文本;

(2)采用基于商品要素的覆盖度机制消除冗余信息。传统覆盖度机制仅能在词维度进行去冗余,难以处理相关词冗余问题。如图2(c)所示,“noise”、“quiet”和“tranquil”均在描述“运行声音”这一商品要素,如果仅对“noise”进行去冗余,难以保证“quiet”和“tranquil”不出现摘要中。本文提出的模型通过商品要素维度的去冗余,可以避免“noise”、“quiet”和“tranquil”同时出现在摘要中;

(3)通过商品要素放回跳机制提高摘要的可读性。如图2(d)所示,商品要素的回跳描述降低了商品摘要的连贯性,影响了消费者的阅读体验。本文提出的模型通过解码时禁用回跳要素词,有效地避免了这一现象。

如表1所示,本文提出的带有的多模态商品摘要模型,MMPG模型取得了比所有基于纯文本的模型更好的结果,这证明了商品视觉信息和商品要素信息在商品摘要任务中起着重要的作用。

表1

论文提出了一个多模态商品摘要模型,其可以利用商品图像、标题和其他文本介绍,为商品生成摘要。文中提出的模型可以有效地利用商品的视觉信息,并反映商品的特色要素,从重要性、非冗余性和可读性的角度对商品要素进行了有效的建模。

对于电商而言,海量商品的营销内容在由达人供稿的过程中,受限于达人写作的效率限制,商品更新速度明显高于营销内容上线速度,导致内容短缺。

AI生成内容在生成效率、曝光点击率、订单转化率等方面其实都表现出了优于人工创作营销的内容。该方法正在应用于垂直电商、综合电商、社交电商、新媒体平台等众多场景。

P.S 同时也欢迎对NLP、文本生成和自动文摘感兴趣的小伙伴加入我们。相关信息咨询,可在后台给我们留言哦~

京 东 AI 研 究 院

京东AI研究院专注于持续性的算法创新,多数研究将由京东实际的业务场景需求为驱动。研究院的聚焦领域为:计算机视觉、自然语言理解、对话、语音、语义、机器学习等实验室,已逐步在北京、南京、成都、硅谷等全球各地设立职场。

欢迎点击“阅读”了解京东智联云AI研究院!

原文地址:https://www.cnblogs.com/jdclouddeveloper/p/12616704.html

时间: 2024-07-29 12:35:42

京东商城背后的AI技术能力揭秘 - 基于关键词自动生成摘要的相关文章

千人千面、个性化推荐,解读数据赋能商家背后的AI技术

12月6-7日,由阿里巴巴集团.阿里巴巴技术发展部.阿里云云栖社区联合主办,以"2016 双 11 技术创新"为主题的阿里巴巴技术论坛,来自商家事业部的技术总监魏虎给大家分享了数据赋能商家背后的AI技术.首先对大数据和人工智能进行了简要介绍,接着着重分析了客户运营平台,包括实时分群算法.match和rank框架以及千人千面技术,最后讲解了千牛头条.服务市场和智能客服中AI技术的应用. 背景介绍 大数据 大数据主要有四个特征:Volume(大量).Value(价值).Velocity(速

【krpano技术】二维码自动生成插件(源码+介绍+预览)

简介 在krpano生成的全景支持HTML5在手机中展示,而在手机中打开全景网址时不方便,需要输入网址. 最近研究了如何让krpano全景根据自己当前的网址,自动生成二维码,并在电脑浏览时,可以展示出来,效果如下: 点击后,会根据屏幕自动放缩到合适大小,方便手机进行二维码扫描. 使用说明 插件有两个文件 把他们复制到项目目录下,在你项目的xml文件中,添加如下的代码即可: <include url="qr.xml" devices="desktop" />

输入关键词自动生成文章软件!提供技术开发原理

朋友们大家好!今天又要来给大家上一课吧,关于输入关键词自动生成文章的软件大家觉得网上有没有?答案:肯定是没有!那么我们今天就给大家带来这么一款软件,我们只需要输入你的关键词就能自动生成原创文章,这个工具是我用易语言开发的,我们先给大家演示一下吧! 大家看到了确实是可以生成的,代码其实非常上,我们给大家看下代码吧!主要就是对接了第三方的API实现的.总共算下来代码还不到10行,居然可以实现这种效果,其实并不是我的软件开发的厉害,而是对接了第三方平台提供的API接口,那么这个接口地址我们不方便提供哈

百度强势入场,AI们集体打 call:揭秘百度智能客服背后的语音技术与应用

两年前的今天,AI流行下围棋:今天,AI流行打电话-- 这个潮流的最近一次上演,是几天前的百度AI开发者大会上,李彦宏现场播放了百度AI客服邀请开发者的真实电话录音. 当时我就在现场,第一通电话里那位开发者方言比较重,到底说了什么我基本没听懂.但百度的AI却应对自如,在电话中回答了各种问题. 第二通电话更神了,那位女开发者发现了小度的AI身份,直接问百度给ta发钱吗,结果被小度用一句"百度给我免费充电",巧妙的"回撩"了过去. 在众人的惊叹中,我们很容易发现让AI打

AI端侧落地,京东AI技术如何部署边缘?

导语:随着物联网的快速发展,越来越多的用户希望将 AI能力下沉到边缘层,让边缘设备能够自动处理关心的一些数据,再把结果上报到云平台.这样做既节省了资源,又提高了运算效率. 随着技术进步,手机等移动设备已成为非常重要的本地深度学习载体,然而日趋异构化的硬件平台和复杂的终端侧的使用状况,让AI技术在端侧的应用能力颇受挑战.端侧模型的推理往往面临着算力和内存的限制,为了能够完整的支持众多硬件架构,并且实现在这些硬件之上人工智能应用性能的优化,不少科技公司开启了深入研究.技术媒体InfoQ上周采访了京东

致5年经验的IT人:从现在起,决定你未来高度的将不再是你的技术能力

你眼中的世界,一定是你心中想当然的世界.通过别人的眼睛看世界,才能够突破自己的思维模式, 前几天和朋友见面,聊起华为年初清理34岁以上职员及大龄程序员的话题,一致认为:技术人员一定不要因为工作忙.圈子窄而放弃了学习思考.开阔眼见.保持社交的机会.否则35多岁以后,很容易陷入技术人员大龄危机:技能不一定拼得过年轻人.常年专注技术视野没什么变化,从而竞争力大打折扣. 不要小觑这种现象,技术人员的对技术的偏执和热衷,会让他对很多在自己关注范围以外的信息熟视无睹,只习惯于关注自己在乎的部分,人对事物的认

京东再出发,用技术与雀巢创造智慧供应链新型合作

(上图为京东.雀巢联合销售预测与补货项目团队合影) 2016年11月底,京东对外宣布成立Y事业部,目的是用智能重构供应链管理,打造京东智慧供应链.2017年初,京东Y事业部首次对外发布战略,预计到今年年底京东80%的核心产品将实现自动补货和定价推荐,同时有近百家企业接入京东智慧供应链.2017年6月7日,京东雀巢联合预测补货项目就获得了2016中国ECR优秀案例白金奖. ECR(Efficient Consumer Response)是指以提高商品供应效率为目标,广泛应用信息技术和沟通工具,通过

华为腾讯用户隐私互怼的背后,AI才是重点!

日前,中国硬件巨头华为,软件巨头腾讯,因<华尔街日报>一篇名为<华为和腾讯陷入用户数据之争 后者要求政府介入>的报道而成为了媒体关注的焦点. 华为手机曾在此前推出一款荣耀Magic手机,它也被称为华为第一款人工智能手机,它可以通过收集数据从而达到智能推荐等功能,而这些数据里面就包括了微信聊天记录等大量信息. 在<华尔街日报>的报道中,双方互撕的焦点集中在用户数据上.腾讯方面认为,华为手机收集微信用户数据的做法实际上夺取了腾讯数据,侵犯了微信用户的隐私.而华为方面却认为,

AI技术的环保水平2020年将更上一层楼

导读 人工智能(AI)技术的环境影响,近期引发了人们的普遍关注——我坚信,这也将成为AI在未来十年内的一大核心难题.这场对话始于艾伦AI研究所的最新研究,他们主张优先考虑“绿色AI”的实现通道,即更多关注AI系统的能源效率. 人工智能(AI)技术的环境影响,近期引发了人们的普遍关注——我坚信,这也将成为AI在未来十年内的一大核心难题.这场对话始于艾伦AI研究所的最新研究,他们主张优先考虑“绿色AI”的实现通道,即更多关注AI系统的能源效率. 这项研究的动机在于,艾伦研究所发现目前AI领域的各类重