NVIDIA | 一种重建照片的 AI 图像技术

简评：或许可以称之为「擦擦乐」~ 建议大家看看视频示例 ~

前几天，NVIDIA 的研究人员介绍了一种新的深度学习方法，使用该方法可以重建缺失像素的图像内容。

这种方法被称为「image inpainting」，可以在图像编辑软件中去除不需要的内容，同时用计算机生成的内容进行填充。

虽然有点类似于 PS 中「内容识别」的效果，但是这种新的方法能够处理更大范围的图像缺失，而不仅仅限制在图像中心附近的矩形区域。

简单说就是用神经网络自己想象空白部分的细节。

【Research at NVIDIA- AI Reconstructs Photos with Realistic Results】

研究团队训练这个神经网络，首先生产了 55116 个随机条纹和任意形状大小的孔径，并且创建了 25000 个测试。为了提高重建的准确性，团队根据输入图像的大小进一步分为了 6 类：

为训练生成的蒙版示例

数据集采用 ImageNet，Places2 和 CelebA-HQ。

在训练阶段，将缺失部分引入上述数据集的完整训练图像中，以使网络能够学习重建像素；

在测试阶段，将没在训练期间应用的缺失部分引入数据集中的测试图像里，用以无偏验证。

过往的方法很容易出现颜色差异或者伪像的弊端，但这种新方法由于不依赖必须提供给神经网络确定的输入值，因而输出值与每个接受域缺失像素的值无关，所以这个模型效果要胜过以前的方法。

Reference：

· New AI Imaging Technique Reconstructs Photos with Realistic Results

· [1804.07723] Image Inpainting for Irregular Holes Using Partial Convolutions

· 用 VR 的方式浏览源代码

? zhuanlan.zhihu.com

原文地址：https://www.cnblogs.com/jpush88/p/9034880.html

时间： 2024-10-31 20:56:03

NVIDIA | 一种重建照片的 AI 图像技术的相关文章

三维图像技术与OpenGL基础理论

英文原文:3D Graphics with OpenGL Basic Theory 中文译文:三维图像技术与OpenGL基础理论 1. 计算机图像硬件 1.1 GPU(图像处理单元) 如今,计算机拥有用来专门做图像处理显示的GPU模块,拥有独立的图像处理储存(显存). 1.2 像素和画面任何图像显示都是基于栅格的格式.一个栅格既是一张二维的像素直角坐标网.像素具有两个属性:颜色和位置.颜色通常使用RGB(红绿蓝)来表示,典型的有用8位或者24位二进制位(真彩色)表示一种颜色.位置则用坐标(x,

谷歌那让人“呵呵”的图像技术

其实,谷歌在图像技术方面没搞明白的,可不仅仅只是libjpeg的optimize_mode参数那么简单. 跟安卓系统在图像内存管理方面的“糊涂”比起来,图片品质还真算不上个事,质量差点大家还能忍,内存管理不当则会导致应用的崩溃(OOM :Out of Memory)可就真没人能忍了. Bitmap很占内存,那到底会占多少内存呢?计算起来很简单,如果你需要显示一个长宽均为612个像素的正方形图片,对应的Bitmap对象需要612*612*4=1498176个字节的内存,即大约不到1.5MB的内

四种加载React数据的技术对比(Meteor 转)

1.四种加载React数据的技术对比(Meteor 转) : https://sanwen8.cn/p/31e4kdE.html 2. Meteor + Appolo TelescopeJS/Telescope https://github.com/TelescopeJS/Telescope/tree/devel http://nova-docs.telescopeapp.org/architecture.html

揭秘几种最主要的挂马技术

网页挂马是攻击者惯用的入侵手段,其影响极其恶劣.不仅让站点管理者蒙羞,而且殃及池鱼使站点的浏览者遭殃.不管是站点维护者还是个人用户,掌握.了解一定的网页挂马及其防御技术是非常必要的. 1.关于网页挂马网页挂马就是攻击者通过在正常的页面中(通常是网站的主页)插入一段代码.浏览者在打开该页面的时候,这段代码被执行,然后下载并运行某木马的服务器端程序,进而控制浏览者的主机. 2.获取Webshell 攻击者要进行网页挂马,必须要获取对站点文件的修改权限,而获取该站点Webshell是最普遍的做法.

由横瓜先生发起的一种新型的引力波网络传输技术的大讨论

Uyuw's Concert Time Limit: 6000MS Memory Limit: 65536K Total Submissions: 6587 Accepted: 2611 Description Prince Remmarguts solved the CHESS puzzle successfully. As an award, Uyuw planned to hold a concert in a huge piazza named after its great d

图像技术分析图像编辑器核心技术

图像技术都是想通的,要举一反三,从中思考出核心,使其变幻莫测.一个合格的图像编辑器所要有的技术框架:

又要刷屏，苹果将增强AR图像技术，毫无违和感

原文标题:又要刷屏,苹果将增强AR图像技术,毫无违和感今天苹果公开了一项新的专利,通过使用这项技术 ,一些AR应用能够在呈现AR图像时将它与现实存在物体之间那种奇怪的违和感消除,让AR图像变得与显示图像更加相似. 对于VR软件,苹果似乎一直都没有什么大动作,但是对于AR技术苹果明显抱有极大的兴趣.苹果CEO库克表示,虽然对于AR还没有彻底了解,但他已经认识到了它的潜力.对此有不少人预言iPhone上将搭载了AR机能,今日的一项发现让人们更加确认了这一可能性. 今天苹果公开了一项新的专利,它就是

Imaging Techniques in Document Analysis Processes(文档分析过程中的图像技术)

4. Imaging Techniques in Document Analysis Processes(文档分析过程中的图像技术) ContentsIntroduction. ....................................................................................... 74Basic Image Processing Algorithms. ....................................

Magnostics Image-based Search of Interesting Matrix Views for Guided Network Exploration（一种基于网络信息矩阵图像的网络探索方法）

网络.关系等数据变成如图的邻接矩阵时(红色代表两个节点也就是人,之间有联系),但是得到的矩阵会因为顺序的问题而出现不同的排列方式,在第一种中会发现因为有聚集的块状区域而很容易地把数据分为两个部分,然后根据数据的具体含义而得知其代表的意思,在此图中可以看出是两个集团. 当分析数据时候,把它转换成矩阵的形式,并运用一些矩阵重排序算法将矩阵变形,变成特定的图案pattern.而现在希望基于图像来查询哪些变形好的矩阵属于同一种pattern. 当前的数据量特别大,数据维度特别多,样式复杂多变,对于探测特