Google 超分辨率技术 RAISR

每天都有数以百万计的图片在网络上被分享、储存,用户借此探索世界,研究感兴趣的话题,或者与朋友家人分享假期照片。问题是,大量的图片要嘛被照相设备的像素所限制,要嘛在手机、平板或网络限制下被人为压缩,降低了画质。

  如今高分辨率显示屏幕正在家庭和移动设备上普及,因此,把低分辨率图片转化为高清晰版本,并可在多种设备上查看和分享,正在成为一项巨大的需求。日前,Google 推出了一项新技术 RAISR,其全称是“Rapid and Accurate Image Super-Resolution”,意为“快速、精确的超分辨率技术”。

  RAISR 这项技术能利用机器学习,把低分辨率图片转为高分辨率图片。它的效果能达到甚至超过现在的超分辨率解决方案,同时速度提升大约 10 至 100 倍,且能够在普通的移动设备上运行。而且,Google 的技术可以避免产生混叠效应(aliasing artifacts)。

  之前已经具有透过升采样方式,把低分辨率图片重建为尺寸更大、像素更多、更高画质图片的技术。最广为人知的升采样方式是线性方法,即透过把已知的像素值进行简单、固定的组合,以添加新的像素值。因为使用固定的线性过滤器(一个恒定卷积核对整个图片的无差别处理),该方法速度很快。但是它对于重建高清作品里生动的细节有些力不从心。正如下面这张图片,升采样的图片看起来很模糊,很难称得上画质提升。

  

  ▲ 左为原始图片;右为升采样处理后图片。

  对于 RAISR,Google 另辟蹊径得采用机器学习,用一对低分辨率、高分辨率图片训练该程序,以找出能选择性应用于低分辨率图片中每个像素的过滤器,这样能生成媲美原始图片的细节。目前有两种训练 RAISR 的方法:

  • 第一种是“直接”方式,过滤器在成对高、低分辨率图片中直接学习。
  • 第二种方法需要先对低分辨率图片应用低功耗的的升采样,然后在升采样图片和高分辨率图片的组合中学习过滤器。
  • “直接”方式处理起来更快,但第二种方法照顾到了非整数范围的因素,并且更好地利用硬件性能。

  无论是哪种方式,RAISR 的过滤器都是根据图像的边缘特征训练的:亮度和色彩梯度、平实和纹理区域等。这又受到方向(direction,边缘角度)、强度(strength,更锐利的边缘强度更高)和黏性(coherence,一项量化边缘方向性的指标)的影响。以下是一组 RAISR 过滤器,从一万对高、低分辨率图片中学习得到(低分辨率图片经过升采样)。该训练过程耗费约 1 小时。

  

  注:3 倍超分辨率学习,获得的 11×11 过滤器集合。过滤器可以从多种超分辨率因素中学习获得,包括部分超分辨率。注意当图中边缘角度变化时,过滤器角度也跟着旋转。相似的,当强度提高时,过滤器的锐利度也跟着提高;黏性提高时,过滤器的非均相性(anisotropy)也提高。

  从左至右,学习得到的过滤器与处理后的边缘方向有选择性的呼应。举例来说,最底一行中间的过滤器最适合强水平边缘(90 度梯度角),并具有高黏性(直线的而非弯曲的边缘)。如果这个水平边缘是低对比度的,那么如同图中最上一行,另一个过滤器就被选择。

  实际使用中,RAISR 会在已经学习到的过滤器列表中选择最合适的过滤器, 应用于低分辨率图片的每一个像素周围。当这些过滤器被应用于更低画质的图像时,它们会重建出相当于原始分辨率的细节,这大幅优于线性、双三(bicubic)、兰索斯(Lancos)解析方式。

  

  ▲ RAISR 演算法运行图式下:原始图像(左),2 倍双三解析(中),RAISR 效果(右)。

  一些运用 RAISR 进行图片增强的范例:

  

  ▲ 上:原始图片,下:RAISR 2 倍超分辨率效果。

  

  ▲ 左:原始图片,右:RAISR 3 倍超分辨率效果。

  超分辨率技术更复杂的地方在于如何避免混叠效应,例如龟纹(Moire patterns)和高频率内容在低分辨率下渲染产生的锯齿(对图像人为降级的情形)。这些混叠效应的产物会因对应部分的形状不同而变化,并且很难消除。

  

  ▲ 左:正常图像;右:右下角有龟纹(混叠效应)的图像。

  线性方法很难恢复图像结构,但是 RAISR 可以。下面是一个例子,左边是低分辨率的原始图片,左 3 和左 5 有很明显的空间频率混淆(aliased spatial frequencies),而右侧的 RAISR 图像恢复了其原始结构。RAISR 的过滤器学习方法还有一项重要的优点:用户可以把消除噪音以及各类压缩演算法的产物做为训练的一部分。当 RAISR 被提供相应的范例后, 它可以在图片锐化之外学会消除这些效果,并把这些功能加入过滤器。

  

  ▲ 左:有强混叠效应的原始图片;右:RAISR 处理后效果。

  超分辨率技术利用不同的方法已经有了不少进展。如今,透过把机器学习与多年来不断发展的成像技术相结合,图像处理技术有了长足的进步,并带来许多好处。举例来说,除了放大手机上的图片,用户还可以在低分辨率和超高清下捕捉、储存、传输图像,使用更少的移动网络数据和储存空间,而且不会产生肉眼能观察到的画质降低。

  小结:自从乔布斯 2010 年在 iPhone 4s 上推出“视网膜屏幕”概念之后,数码产品市场开启了一场超高清显示革命。如今,家用显示器逐步走向 4K,各大手机厂商也竞相推出 2K 旗舰机。但 2K、4K 内容的缺乏一直是困扰行业发展的痛点。之前的超分辨率技术受成本、硬件限制,主要应用于专业领域,未能大范围普及。

  此次 Google RAISR 大幅降低了图像增强的时间成本和硬件要求,有望实现超分辨率技术在消费领域的应用,把充斥网络的低画质图片转化为高清图片,大幅提高视觉效果和用户体验。雷锋网十分期待将来 RAISR 在移动设备的应用,例如把消费者手机拍摄的照片转化为媲美单反画质的高清美图。

英文论文地址:

Google Research Blog:

谷歌产品博客今日发文介绍其图像压缩技术RAISR,RAISR于去年11月推出,利用机器学习生成高质量版本的低分辨率图像,使加载每张高清大图片使用的带宽减少75%。

专业、技能高超、有独特风格的许多摄影师们都早已在 Google+ 上建立博客,以支持社区及分享他们的作品。无论是玩具、旅行风景还是街头艺术,每张照片都有一个独特的故事,值得以最佳的分辨率来欣赏。

传统上,以高分辨率欣赏照片意味着需要使用大量带宽,导致加载速度变慢,数据成本升高。对许多人来说,尤其对数据价格高昂或互联网接入速度慢的地区的人来说,这是一个值得关注的问题。

为了让每个人都能观看到摄影师分享到 Google+ 的高清照片,我们利用机器学习和名为 RAISR 的新技术试图解决这个问题。RAISR 于11月推出,利用机器学习生成高质量版本的低分辨率图像,以让人们能够欣赏到摄影师的美丽照片。通过使用 RAISR 来显示 Google+ 上的大图片,我们能使每张图片使用的带宽减少 75%。

虽然我们只在安卓设备子集流中出现高分辨率图片是才推出此功能,但我们已经每周使用 RAISR 压缩超过10亿张图片,为用户降低了约三分之一的总带宽。接下来几周里,我们计划更广泛地推广这项技术,以进一步节省时间和数据成本。

时间: 2024-10-06 00:12:15

Google 超分辨率技术 RAISR的相关文章

[转]图像超分辨率重建简介

图像超分辨率重建技术就是利用一组低质量.低分辨率图像(或运动序列)来产生单幅高质量.高分辨率图像.图像超分辨率重建应用领域及其宽广,在军事,医学,公共安全,计算机视觉等方面都存在着重要的应用前景.在计算机视觉领域,图像超分辨率重建技术有可能使图像实现从检出水平(detection level)向识别水平(recognition level)的转化,或更进一步实现向细辨水平(identification level)的转化.图像超分辨率重建技术可以提高图像的识别能力和识别精度.图像超分辨率重建技术

基于学习的超分辨率算法

基于学习的超分辨率技术最早是由卡耐基一梅隆实验室的 Baker S在2000年提出的.他们提出一种基于识别先验 知识的方法,通过算法去学习训练指定类别,将得到的先验 知识用于超分辨率.随后,多伦多大学的 Hertzmann a等提 出了基于多尺度自动回归的图像类比算法.麻省理工学院的 Freeman WT5等提出了一个基于例子的方法,利用马尔可夫 网络来学习训练库中与低分辨率图像不同区域相对应的高分 辨率图像的细节,再用学习得到的关系来预测输入低分辨率 图像的细节信息. Christopher

JPEG压缩图像超分辨率重建算法

压缩图像超分辨率重建算法学习 超分辨率重建是由一幅或多幅的低分辨率图像重构高分辨率图像,如由4幅1m分辨率的遥感图像重构分辨率0.25m分辨率图像.在军用/民用上都有非常大应用. 眼下的超分辨率重建方法主要分为3类:基于插值.基于学习.基于重建的方法.现在已经研究得比較多.可是大多数算法都是对普通图像进行研究,针对压缩图像/视频超分辨率重建的研究比較少.近期查阅部分文献.进行了学习.在此做些总结. 相关的文献: 1.Super-resolution from compressed video 2

百度和 Google 的搜索技术是一个量级吗?

著作权归作者所有. 商业转载请联系作者获得授权,非商业转载请注明出处. 作者:Kenny Chao 链接:http://www.zhihu.com/question/22447908/answer/21435705 来源:知乎 很多答案是从使用上讲的,我加两个技术方面的. 搜索引擎需要对抓取到的结果进行管理.当索引结果越来越多时,保证存储和查询速度,保证数万台服务器内容一致的难度越来越高.Google于03至06年左右公布了三篇论文,描述了GFS.BigTable.MapReduce三种技术以解

图像超分辨率项目帮你「拍」出高清照片

相机不够算法凑,拥有超级拍照能力的手机也离不开算法的加持.本文介绍的图像超分辨率项目可以帮你补齐相机镜头的短板. 华为 P30 发布会上展示的埃菲尔铁塔高清远距离照片 今天,一位 Reddit 网友贴出了自己基于 Keras 的图像超分辨率项目,可以让照片放大后依然清晰.先来看一下效果. 放大数倍后,照片中的蝴蝶(蛾子?)依然没有失真,背上的绒毛清晰可见 作者表示,该项目旨在改善低分辨率图像的质量,使其焕然一新.使用该工具可以对图像进行超级放缩,还能很容易地在 RDN 和 GAN上进行实验. 该

超分辨率重建——背景与研究意义

一个课题,首先别人会问你为什么会研究这个,所以这是必须的. 超分辨率重建是指通过对数字图像信号的分析,采用软件算法的方式,由一帧或多帧图像重建转化成更高分辨率图像或视频的技术. 既然采用软件的算法,必然是因为硬件上的不足,那么当前硬件上存在哪些技术性的不足呢,下面有请: 1: 减小传感器中的像素尺寸,提高阵列密度 一方面技术工艺限制,另一方面当像素尺寸减小到一定程度时,加性噪声几乎维持不变,有效信号的能量将随传感器像素尺寸成比例减小,导致所形成图像的信噪比下降,退化反而加重 2:增大成像阵列芯片

【超分辨率专题】—基于深度学习的图像超分辨率最新进展与趋势

1.简介 图像超分辨率是计算机视觉和图像处理领域一个非常重要的研究问题,在医疗图像分析.生物特征识别.视频监控与安全等实际场景中有着广泛的应用.随着深度学习技术的发展,基于深度学习的图像超分方法在多个测试任务上,取得了目前最优的性能和效果.本文介绍的一篇综述(Deep Learning for Image Super-resolution:A Survey)给出了一个统一的深度学习视角,来回顾最近的超分技术进展,主要包括三个方面: 给出了综合性的基于深度学习的图像超分技术综述,包括问题设置.数据

用一个玩具例子说明基于视频的超分辨率重建的基本思想

本文是基于知乎上的一个答案 基于视频的超分辨率重建是指从许多帧连续的低分辨率图像中重建出一幅高分辨率的图像,并且这幅高分辨率的图像能够显示出单帧低分辨率图像中丢掉的细节,比如下面是一个2秒视频(176x144)中的一帧: 为了方便和分辨率重建之后的图片对比,用Nearest Neighbor放大到了704x576.而下面是重建后的超分辨率图像: 可以看到,许多丢失的细节被重建了,这就是基于视频序列的超分辨率重建. 接下来用一个玩具例子来说明基本原理,首先打开画图板,写下一个线条分明,软绵无力,面

私有云建设之超融合技术

目前,在私有云建设(很多可能并不是真正的私有云,也包括一些虚拟化平台的建设)中,超融合出现的身影越来越多,本文 我们探讨下超融合技术. 一 什么是超融合 既然在说超融合架构,那就肯定有一般的融合架构,这其实也是目前行业内对于超融合定义争论的焦点,也就是说哪些定义为 融合架构,哪些定义为超融合架构. 个人来说比较倾向于以下定义:天然地(Natively)将两个或多个组件组合到一个独立的单元中,这句话的关键词是天然地 (Natively).这种定义有个好处就是留了很多自由解释的空间,没有把这个边界框