Pixel相机是怎么做到自动补抓最不错的自拍照

网络大厂 AI研究团队近日在最新的Pixel相机中,于无快门模式Photobooth新增亲吻侦测功能,当用户亲吻自己的爱人时,相机会自动捕捉这一瞬间。网络大厂过去是藉由Photobooth模式,让用户更简单地成功自拍,不管是一个人、情侣或是团体照,都能够自动捕捉到最好的画面。网络大厂表示,要拍出一张好的团体自拍照其实不太容易,为了能够降低自拍的困难,网络大厂研究团队将自动摄影技术带到Pixel手机上,一旦用户进入Photobooth模式并按下快门键,系统将会自动在相机稳定,且同时确保拍摄对象有好表情的时候拍摄。

在一系列的Pixel相机功能中,网络大厂于Photobooth加入了Top Shot和肖像(Portrait )模式,来让用户尽可能拍出最好的照片,有别于针对后置镜头专用硬件优化的肖像模式,Photobooth则是针对前置镜头进行优化,为了建置Photobooth,网络大厂必须克服3项挑战:如何在团体中正确辨识好内容、如何计算按下快门捕捉最佳时刻的时间,以及如何制作视觉动画帮助用户了解Photobooth看见的画面。首先,网络大厂研究团队建立了用来理解好内容的模型,Photobooth仰赖两个不同的模型来捕捉好的画面,一个是脸部表情模型,另一个则是检测用户何时亲吻的模型,网络大厂与摄影师合作,整理了5个应该触发自动拍摄的关键表情:微笑、伸舌头、亲吻(或是都嘴)、鼓起脸颊和警喜的表情,接着,网络大厂训练神经网络针对这些表情进行分类。

相机系统自动辨识表情的下一步,就是要控制快门,用户使用Photobooth模式按下快门后,系统会根据上述的模型辨识结果,针对画面内容给予基本的质量评估分数,第一阶段会将不好的画面过滤掉,像是闭眼睛、讲话、动作模糊、侦测脸部表情失败等,Photobooth会暂时分析表情的信心值,来侦测拍照对象在照片中的表现,第一阶段若成功通过,每一帧会受到更细化的分析,来产生整体的评分结果。整体的画面评分考虑因素包含脸部表情质量和亲吻分数,由于亲吻侦测模型是针对整个画面来执行,侦测输出的结果可直接用于全画面的分数值,而脸部表情模型是针对个别被摄者表情输出结果,Photobooth利用attention模型将侦测到的表情,透过迭代的方式计算出表情质量的代表值,以及每个脸的权重,网络大厂指出,权重相当重要,举例来说,权重能够强调画面的前方区域,模型接着会为画面的表现质量,计算出一个通用的分数。内容相关来源:sbf胜博网址 http://tpmanager.org.tw/
最后,模型计算出的影像质量分数,被用来触发快门,为了找出拍摄出最佳质量的瞬间,快门控制算法保留了观察画面的短缓冲区,若一个画面的质量分数比缓冲区之后的分数高,系统才会保存该张照片,而缓冲区的时间也足够短暂,让使用者认为Photobooth是实时的回馈。由于自拍时使用者使用的是前置镜头,能够与屏幕上呈现的画面互动,网络大厂也在Photobooth模式中加入了视觉的指引,当用户要拍照时,屏幕上方会出现一个直方图案,当照片质量增加时,该直方图案的尺寸也会变大,藉由这样可视化的方式,协助用户理解机器学习算法看见和捕捉的画面,该直方图案的长度被分为4段,一是无法辨识清楚的脸部,二是可辨识脸部但是使用者并没有看向镜头,三则是有看镜头但是没有出现上述5种关键表情,最后则是有看向镜头且出现关键表情,长条指示图案会随着照片质量变动,当到达高质量分数时,Photobooth就会拍下并保存照片。

原文地址:https://blog.51cto.com/13220658/2380209

时间: 2025-02-01 15:50:53

Pixel相机是怎么做到自动补抓最不错的自拍照的相关文章

Centos 6.6命令行实现自动补全

公司同事用的ubuntu系统,自动补全功能不错,但是本人的Centos 6.6系统使用sudo的时候就不能自动补全了,git命令也不能自动补全. 网上搜索一番解决方法如下. 一  git不能补全问题 下载git源码 $ git clone https://www.kernel.org/pub/scm/git/ 找到git-completion.bash文件拷贝到 -/目录下 $ sudo cp contrib/completion/git-completion.bash -/.git-compl

【转】快速开发平台:大湿教我写程序(3)之自动补全(屌丝没有春天)篇

一.女神也爱玩撸码 "在么,亲." "在!在!有,有事么"(我真睡醒了么!垂涎了好久的女神呀!高中同学,高一向她表白,"我想找个170以上的",高二等我长到170了"我想找个175的",高三下血本买了双内增高"我喜欢178以上的,有安全感") 三分钟后.... "没事也可找我的."擦,我TM怎么这么不争气,不是发过誓等她主动跟我讲话的时候就送她一个字:滚! "有个网页不会做,你

jquery autocomplete实现读取sql数据库自动补全TextBox

项目需要这样子一个功能,其他部门提的意见,只好去实现了哦,搞了好久才弄出来,分享一下. 1.前台页面 <%@ Page Language="C#" AutoEventWireup="true" CodeFile="Default3.aspx.cs" Inherits="Default3" %> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transiti

Elasticsearch in java 范例:自动补齐功能(completion suggester)

ES(elasticsearch)的suggester共有四类(term suggester, phrase suggester, completion suggester, context suggester), 其中completion suggester作为搜索框中的自动补齐功能,尤为常用. 本文将用java语言实现一个简单例子来叙述如何使用completion suggester. 例子的主要功能是为股票的名称和编号建立自动补齐功能. 实现一个完整的completion suggeste

VIM的自动补全

自动补全可以很好的提高输入的效率: 触发自动补全的方法总结: 可供弹出式菜单的使用的命令: 其它再补充:

Linux Vim中自动补全Python插件:Pydiction

Pydiction 可以是我们使用Tab键自动补全Python代码在Vim,是一款非常不错的插件. Pydiction不需要安装,所有没有任何依赖包问题,Pydiction主要包含三个文件. python_pydiction.vim  -- Vim plugin that autocompletes Python code. complete-dict         -- Dictionary file of Python keywords, modules, etc. pydiction.p

Ubuntu 16.04.2 LTS 安装python vim自动补全工具pydiction

Pydiction 可以是我们使用Tab键自动补全Python代码在Vim,是一款非常不错的插件. 下载Pydiction mkdir ~/.vim mkidr ~/.vim/tools cd ~/.vim/tools #可以先下载好放到Ubuntu系统中 git clone https://github.com/rkulla/pydiction.git 配置Pydiction #- UNIX/LINUX/OSX: Put python_pydiction.vim in ~/.vim/after

vim 添加php自动补全 并格式化代码

自动补全,修改/etc/vimrc的配置 vim /etc/vimrc 添加: filetype plugin on autocmd FileType php set omnifunc=phpcomplete#CompletePHP 格式化代码:一下是按键 gg shift + v shifg + g = 参考:

Eclipse自动补全功能管理

#这种方法只适用于Eclipse Classic版本(这个版本带有插件的源码) 在使用Eclispe的过程,感觉自动补全做的不好,没有VS的强大.下面说两个增强自动补全的方法: 1.增加Eclipse的提示功能 在Eclipse中,从Window -> preferences -> Java -> Editor -> Content assist -> Auto-Activation下,我们可以在"."号后面加入我们需要自动提示的首字幕,比如"a