全域图像搜索给你更精准的搜索体验

摘要: 2018飞天技术汇,阿里巴巴机器智能技术实验室的刘磊带来题为全域精准图像搜索介绍的演讲,主要从四个方面进行了阐述,第一部分介绍了图像搜索的基本概念,第二部分主要是讲解了图像搜索的技术架构及其优势,第三部分对应用场景及案例进行了分析,最后对商品使用情况以及定价做了简单介绍。

2018飞天技术汇,阿里巴巴机器智能技术实验室的刘磊带来题为全域精准图像搜索介绍的演讲,主要从四个方面进行了阐述,第一部分介绍了图像搜索的基本概念,第二部分主要是讲解了图像搜索的技术架构及其优势,第三部分对应用场景及案例进行了分析,最后对商品使用情况以及定价做了简单介绍。

Alibaba MIT
MIT (Machine , Intelligence ,Technologies 机器智能技术实验室) 成立于2018年,由一批杰出的科学家及工程师组成,团队主要分布在杭州、北京、西雅图、硅谷、新加坡等地,是阿里巴巴负责人工智能技术研发的核心团队。MIT以阿里巴巴宝贵的海量数据为基础,机器学习/深度学习技术为依托,打造了涵盖图像视频、语音交互、自然语言理解、智能决策等人工智能核心技术,充分赋能电商、金融、物流、社交、娱乐等阿里巴巴集团的重要业务,此外也对生态合作伙伴输出,与企业合力打造智能未来。

图像搜索

图像搜索服务(Image Search)是一个以深度学习和大规模机器学习技术为核心,通过图像识别和搜索功能,实现以图搜图的智能图像搜索的产品。其主要的服务内容包括相同图像搜索和相似图像搜索两部分,在基于图像识别技术的基础上,图像搜索服务结合了不同行业的应用和业务场景,帮助用户实现相同或相似的图片搜索。图像搜索的业务领域也较为广泛,对于所有具备图像数据库的用户都可以享受图像搜索服务。
图像搜索发展历程主要分为三个阶段,在2014年8月成功在淘宝的拍立淘上线,用户第一次可以通过相机拍照的方式进行购物,在2017年2月开始了产品的对外商业化输出,将图像搜索的技术分享给各大商业伙伴,今年开始尝试将图像搜索技术在阿里云上进行广泛的赋能,并在7月份完成了图像搜索在阿里云以及全球的同步发布。

技术架构及其优势

图像搜索技术主要分为五个算法模块:

类目预测:仅通过图片特征进行图片的区分是有限制的,所以可以通过类目的预测进行目标判断,这样就无需对整个图像库进行全局搜索,只需搜索相应的某个类目图片。类目搜索不但可以提升搜索的效率,也可以提升搜索的精准程度。
主体检测:在一般情况下得到的图片主体目标较小并且背景较为复杂,为了减少背景以及其他主体的干扰,就需要进行主体检测。
特征提取:特征提取是图像搜索的一个重要模块,主要应用了深度特征与局部特征两个维度的特征,目前深度学习特征提取已经远远优于传统的特征提取。局部特征提取是对图像特征局部殊性的表达,目前在局部特征中进行了包括维度压缩、提取速度的优化等方面的改进。
检索与排序:检索索引主要分为离线构建索引和在线快速查询两个模块,离线构建索引是通过离线过程对图像特征进行提取,在线过程主要是通过用户输入的特征图片进行快速提取特征,然后把提取出的特征放到分布式引擎中,进行快速的查询检索。排序模块能够有效结合深度特征与局部特征,深度特征主要从高层来提取信息,而局部特征关注的是根据图像的局部信息。
图像搜索的技术流程

离线流程对图像库进行图像的选取,对选取后的图像进行主体检测,然后对检测后的图像进行特征提取,进而建立起图像检索引擎。在线流程是在用户输入Query时,进行类目的预测和判断,然后做主体检测以及特征提取,进行检索和排序后,最后输出结果。

图像检索的优势
深度学习采用业内领先的深度学习算法和海量的数据,具有效果精准、鲁棒性强等优点,并且自主研发支持百亿数量级别的快速索引技术,时间可以达到毫秒级的响应,同时产品全都是源于阿里巴巴电商平台,经历实战锤炼,所以具有可靠稳定以及效果显著的优点。此外还可以针对不同的业务场景做一些定制化开发,融合阿里云的计算和机器智能技术实验室的视觉AI的能力,打造充分适合用户全业务场景的图像搜索服务。

应用场景及案例
电商场景

用户只需拍摄或者上传照片,就可以根据图片进行搜索。这省去了繁琐的文字描述,简化了商品搜索流程,大大提高了用户的购物体验,同时对于商家而言也可以更快地将商品推荐给用户。

通用图库场景

图片分享和社交类网站通常有大量的图片供用户搜索使用,利用图像搜索服务,可在云端快速构建百亿级图像搜索引擎,提供以图搜图功能,提升用户体验。

案例

此案例是在三星Galaxy S8的系统中做了一个图像搜索技术,在相册中可以通过以图搜图的方式搜索到淘宝相关的商品,给客户提供了更好地购物搜索体验。

商用与定价

图像搜索已于7月11日在国内站和国际站同时商业化发布,得到客户的广泛好评。目前计费方式有两种,分别是预付资源包和后付费。预付资源包是在图像搜索服务采用购买按月/按年(自然月/自然年)预付费资源包的计费方式。在购买后,调用次数会在资源包内进行抵扣,当资源包用完时,则默认转到后付费方式。同时预付费资源包采取按照资源包调用量大小及资源包购买期长短进行阶梯优惠的付费方式,资源包的调用量越大/资源包的购买期越长(如:选择包年而非包月)即单价越低。而后付费是在图像搜索服务的预付费资源包用完后,默认转到后付费方式,后付费的计费方式为按次计费。
阅读原文?请添加链接描述

本文为云栖社区原创内容,未经允许不得转载。

原文地址:http://blog.51cto.com/13876536/2152814

时间: 2024-10-14 20:22:26

全域图像搜索给你更精准的搜索体验的相关文章

github 项目搜索技巧-让你更高效精准地搜索项目

目录 github 搜索技巧 案例 普通搜 搭配技巧搜 限定词 查找某个用户或组织的项目 辅助限定词 还没搞懂的(关于 forks.mirror.issues) 排序(放的是官网的链接) 使用指南 练习案例 github 搜索技巧 参考自 B站 up 主 CodeSheep 的视频[如何高效地在网上找开源项目做!在职程序员实际演示一波视频教程操作],然后写着写着一好奇就去看文档了 现在这篇博客相当于官方文档的翻译版?? 当然,你也可以去看[官方文档]体验原汁原味的教程 干啥的?相当于给搜索结果添

视频营销:你的视频是如何被精准目标客户搜索到的?

这是我写的第78篇原创视频营销文章 陈松松,6年视频营销实战经验 有的人发布很多的视频,但一个没有被搜索到,为什么? 因为他不懂视频营销的最新的方法. 每个人都希望更多的精准目标客户主动找上门, 目前分为两种: 第1种:用户主动搜索 第2种:平台推荐流量 很多人只清楚用户主动搜索, 但不清楚,平台推荐流量的最新方法, 实际上无论是搜索还是推荐,核心离不开关键词, 今天就给你详细讲讲. 第1种:用户主动搜索 你在网络上随意搜索你感兴趣的字.问题,发现排名靠前的,大多数在标题里含有你搜索的关键词(红

移动搜索格局已定,微信搜索恐难有大改变!

近日,微信新版本的内测界面流出,已支持朋友圈搜索和附近商户搜索.越来越多迹象表明,微信正在加强搜索功能.在取代聊天工具.移动浏览器.新闻阅读客户端等诸多功能之后,微信还是忍不住进入“搜索”这个非常核心的互联网基础设施,只不过微信搜索瞄准的不是广义搜索,而是狭义的服务搜索,而这也正是百度今年发力的重点. 2014年搜索定局,老二之争激烈 先来看看移动搜索的格局趋势.2014年说是移动搜索最受关注的一年,BAT三大巨头均已入场:百度早已多重卡位自不必说:阿里收购UC之后推出神马搜索专注移动搜索:腾讯

浅谈asp.net通过本机cookie仿百度(google)实现搜索input框自动弹出搜索提示

对于通过用户输入关键词实现自动弹出相关搜索结果,这里本人给两种解决方案,用于两种不同的情形. 常见方法是在数据库里建一个用户搜索关系表,然后通过用户搜索框输入的关键字异步调用数据表中的相关数据,显示在一个隐藏div中. 第二种方式也就是我现在着重讨论的方式,适用于单个用户,基于此用户以往的搜索数据来实现搜索提示功能.技术关键是记录下用户的以往搜索数据,写入cookie,然后页面从用户本机cookie调用数据. ok,下面进入正题.本文主要讲实现步骤,代码可根据自己实际需要更改. 一,如何写入co

c# JD快速搜索工具,2015分析JD搜索报文,模拟请求搜索数据,快速定位宝贝排行位置。

分析JD搜索报文 搜索关键字 女装 第二页,分2次加载. rt=1&stop=1&click=&psort=&page=3http://search.jd.com/Search?keyword=%E5%A5%B3%E8%A3%85&enc=utf-8#keyword=%E5%A5%B3%E8%A3%85&enc=utf-8&qrst=UNEXPAND&as=1&qk=title_key%2C%2C%E5%A5%B3%E8%A3%85&

下载Lucene4.X实战类baidu搜索的大型文档海量搜索系统(分词、过滤、排序、索引)

Lucene是一个高性能.可伸缩的信息搜索(IR)库.目前最新版本是4.3.1. 它可以为你的应用程序添加索引和搜索能力.Lucene是用java实现的.成熟的开源项目,是著名的Apache Jakarta大家庭的一员,并且基于Apache软件许可 [ASF, License].同样,Lucene是当前非常流行的.免费的Java信息搜索(IR)库. Lucene4.X实战类baidu搜索的大型文档海量搜索系统(分词.过滤.排序.索引),刚刚入手,转一注册文件,视频的确不错,可以先下载看看:htt

朴素搜索dfs, 简单的剪枝搜索

为做一个项目选择最合适的语言固然重要,但是,掌握一门自己熟练的兵器,也很重要. ===================================================================================================================== 继续总结搜索类的题目,这一类的题目,目前仅分析简单粗暴的dfs搜索,以及简单的剪枝. 参考的题目: http://acm.hdu.edu.cn/showproblem.php?pid=

深度优先搜索(DFS)与广度优先搜索(BFS)的Java实现

1.基础部分 在图中实现最基本的操作之一就是搜索从一个指定顶点可以到达哪些顶点,比如从武汉出发的高铁可以到达哪些城市,一些城市可以直达,一些城市不能直达.现在有一份全国高铁模拟图,要从某个城市(顶点)开始,沿着铁轨(边)移动到其他城市(顶点),有两种方法可以用来搜索图:深度优先搜索(DFS)和广度优先搜索(BFS).它们最终都会到达所有连通的顶点,深度优先搜索通过栈来实现,而广度优先搜索通过队列来实现,不同的实现机制导致不同的搜索方式. 1.1 深度优先搜索 深度优先搜索算法有如下规则: 规则1

Linux 正式引入讯飞输入法,提供更优质的输入体验

Linux 正式引入讯飞输入法,提供更优质的输入体验Linux 正式引入讯飞输入法,提供更优质的输入体验很多小伙伴都知道,讯飞输入法在手机端有Android和iOS版,还分别推出Windows系统和Mac系统的PC端两个版本.此次推出的讯飞输入法Linux版针对深度DeepinOS进行了深度定制,打造出体验更纯粹的Linux输入法.不仅如此,Linux版输入法界面经过UI团队精心"调教",视觉上更简洁大方.更重要的是讯飞输入法软件纯净绿色,对内置广告say no,因此用户不用担心被讨厌