不可复制的AI螺旋:HUAWEI P20的“长板理论 ”

等待了一年多,HUAWEI P20系列终于来了。相比去年2月底巴展上推出的P10系列,P20晚了一个月并且代号直接跨越了两位数。加上这是五个月之后华为第二款搭载AI芯片麒麟970的手机,这些迹象都在告诉消费者,需要对HUAWEI P20系列抱以更多的期待。

果然,DxOMark排名登顶、徕卡三摄、AI摄影大师等等关键词的出现,标志着HUAWEI P20要在P系列把摄影和AI两棵技能树通通点满。

如今HUAWEI P20系列已经在国内正式发布,我们选择了HUAWEI P20 Pro作为评测对象,今天就通过一系列的简单评测来看看,Mate10发布五个月后的AI手机,发生了怎样的变化。

让软件去追逐算力,手机AI也要物尽其用

作为AI媒体,我们最为关注的自然是HUAWEI P20系列搭载的AI技术。在HUAWEI Mate10系列之后,这是华为第二款搭载了移动AI芯片麒麟970的手机。在上一款手机中,麒麟970已经通过离线翻译、慧眼识物等等功能初步展现了NPU的能力,但在HUAWEI P20系列中,麒麟970的能力成了一块基石,潜入到手机大量基础功能里,为手机的使用感进行了潜移默化的提升。在这里,我们分别对人脸解锁、智慧续航和智慧服务平台几类功能进行了测试。

·人脸解锁

人脸识别解锁之所以能够在今天实现大范围应用,大致有两点原因,第一是前置摄像头等传感器技术的成熟,实现在人脸上形成更多定点,数据的精细度也提高了安全性。第二则是活体检测技术的提高,减少了3D打印等攻击人脸识别的可能,当然这两点也都要建立在强大的端侧算力之上。

在整体算力的提升下,HUAWEI P20系列人脸解锁的速度是非常之快的,即使在暗光环境中,也能通过前置摄像头对光线的补充进行解锁。HUAWEI P20系列具有360度解锁功能,无需在解锁时特意调整人脸角度,让整个解锁过程更加自然和便利。

同时华为在EMUI 8.1中推出了安全TEE人脸架构,把人脸识别中数据采集、特征提取等等储存在华为终端可信运行环境中,再独立于手机其他的模块。这样如果未来会出现大规模的黑客骇侵,或者用户自己的手机中了病毒等等,这一架构将大大减少用户人脸数据被盗取的可能性。

·智慧续航

此前华为也做过很多这种让用户感知不到AI,却提升用户体验的事情。电池续航就是一个典型案例。

当NPU把AI计算封存到本地,一些对用户行为的适当学习也就开始脱敏,解决了用户数据可能泄漏的问题。当手机可以了解用户对App的使用习惯,哪些经常使用,哪些不经常使用,就可以更加精细地在后台对应用功能进行调控,降低那些低频应用的功能,从而在用户不知不觉中提升系统运行的速度和续航能力。

于是当HUAWEI P20 Pro将电池容量提升到4000mAh时,后台智慧调度的效果则变得更加明显,给用户更好的续航体验——用户会觉得同样是4000mAh,HUAWEI P20 Pro的续航能力比其他手机更为强大。这是因为AI的存在让硬件的提升事半功倍。

·智慧服务平台

有关智慧服务,在以往的HUAWEI Mate 10系列、荣耀V10等产品中已经能看到一些样本,比如智慧识屏,长按屏幕识别出关键字,直接跳转到电影购票、地图导航等等第三方服务。

在HUAWEI P20系列中,这样的智慧服务变得更加主动,应用性也更强。比如智慧识屏可以实现文字和图片的分别识别,直接对图片中的商品进行识别,跳转到电商页面,减少用户在App中的反复跳转。

如果用户在现实世界看到不认识的商品,也可以利用摄像头对商品进行实时扫描识别,找到商品的详细信息,甚至可以直接在线购买。

另一项典型的智慧服务功能是智慧旅行,这一功能依据位置信息触发,即用户靠近某个景点时旅行助手会自动触发语音导游、景区美拍等等服务卡片,方便用户进行跳转。将多项关联功能集中在某一场景下主动触发,比起让用户自己发掘自己的需要,然后在散乱的手机应用中进行寻找要方便的多。

图像识别、语音识别以及其他传感器带来的强感知力,让HUAWEI P20系列可以做到更多自主理解,自然也带来了更多主动服务,在无形中提升用户体验。随着移动AI生态的进一步完善,或许在未来垂直情景下的主动智慧服务会成为主流。感知到用户来到商场,手机自动提供大众点评、美团等等应用,用户开始运动,手机自动打开Keep、音乐软件等等应用……让手机从一台被动接受指令的终端变成主动服务用户的助手。

以上这几项功能只是举例,在HUAWEI P20系列中还能发现不少这样的细节,以往频繁的点亮屏幕、切换App、复制粘贴、查找搜索的过程正在被慢慢省去。仔细想想,完成这些工作似乎也不需要继续提高AI芯片的算力。反倒是软件本身的设计正在逐渐与麒麟970的算力进行匹配,物尽其用地主动服务用户。

现在在华为的应用市场中,已经能看到有关人工智能的App专区,在其中能看到图像处理、电商、翻译等等不同类别的产品。

华为现在正在着重推广他们的HiAI移动计算平台,把图像识别、语音识别这些技术开放给应用开发者们,让越来也多的App “AI起来”,或许手机应用全面智能化的未来很快就要到来了。

如何让硬件升级事半功倍?首先你得有个芯片

类似的逻辑也出现在了AI摄影方面。

这次HUAWEI P20系列的摄影功能得到了大量肯定,其中一大部分原因自然是感光器、镜头光圈、色温传感器等等硬件能力的提升。这次HUAWEI P20系列在背后加入了第三个摄像头,除了黑白和彩色成像,又加入了长焦摄像头。其中主摄像头的感光面积达到1/1.7英寸——基本超过了市面上其他所有手机,但同时也离不开AI的加持。

就拿这次变化最大的超级夜景来说,其实在P9系列中就已经存在超级夜景功能了,但那时不能手持相机,需要架上三脚架。原因是当光线不足时,拍摄照片就要把快门开合的过程放慢,保证有更多的进光量。快门时间长,就需要长时间让手机保持在同一位置静止,这时人手就很难保持稳定性了。

在HUAWEI P20系列中最显著的变化,就是不用三脚架,“徒手”也能拍出强大的夜景。这并不仅仅是因为感光元件性能的提升增加进光量,减少了快门所需的时间,还有就是加入了AI防抖能力。AI防抖能力,即是感知因用户手抖产生的画幅移动,再将多帧画面对齐,形成一张清晰的照片。

光从技术上来看,AI防抖的难度不算太高,但真正的难点在于计算速度。就拿咱们平时拍的照片来说,一张照片就要有2-10M,将十几张甚至更多照片进行对其并且合成一张,如果在云端进行其效率必然是无法忍耐的。而NPU的计算能力将整个过程缩短到4秒左右,甚至比在三脚架上长期曝光花费的时间还要短。这样一来才有可能让超级夜景功能产生质变。

至于其他的4D预测追焦、流光快门、熄屏快拍也是一样,优秀的画质依赖于大量的传感器,这些传感器的存在让每一次快门都像一道微积分题,包含了巨大的运算量。

软硬结合的螺旋上升:HUAWEI P20的“长板理论”

这样看来,从HUAWEI P20系列中我们可以看到一种非常有趣的现象:芯片提升了算力,促使软件利用算力提供主动服务能力;算力的提升又让更多传感器的加入成为可能,从侧面提供了提升其它硬件能力的土壤。

如果把HUAWEI P20系列看做一个木桶的话,麒麟970显然是其中的一块长板,并且因为这块长板的存在,才让其他板块也越来越长,最终形成了一个容量更大的木桶。

就像DxOMark评价的一样,HUAWEI P20是一款改变游戏规则的产品。它不仅为手机带来了媲美单反的感光能力和第三个摄像头,而且很有可能会终结手机行业的一个现状——厂商们可能再也无法通过堆砌硬件来获取能力了。

除了华为之外,其他厂商不可以加入更大的光圈、更大的感光元件吗?当然可以。只是在获得足够的计算能力前,这些传感器反而成了一种负担,让手机在繁重的计算任务之间快速耗电和发烫。

所以,AI之于手机绝非是和曲面屏、全面屏一样的“风口”,厂商们学个四五分像就可以蒙混过去。AI应该是一块长板,让软件和硬件围绕着这块长板互相缠绕,呈螺旋状上升,不断补齐手机功能,最终成为一种不可复制的优势。

原文地址:http://blog.51cto.com/naojiti/2103744

时间: 2024-10-01 03:29:21

不可复制的AI螺旋:HUAWEI P20的“长板理论 ”的相关文章

听你声音6秒,AI就能推断你长啥样了!| 技术前沿洞察

大家好,本周的技术前沿又跟大家见面了!就在大家震惊加水就能跑的汽车时候,本周北美高校乃至全球高校都有一些让小探震惊不已的新研究成果...... 比如,AI 能够通过你的声音,推测出你长啥样!(当然,现在好像亚洲人还无法做到......); 只需要一滴唾液或者汗液,就能诊断你的压力有多大...(老板,请你一定要看到这条,说明我请假不是假的--) 到底是怎样发生的?硅谷洞察赶紧带你来看! MIT:听音辨别人的长相 近日,麻省理工学院人工智能实验室(MIT CSAIL)发布了一项令人惊讶的研究--只需

我的投资、理财、财富观

财富是什么?我认为是 人.理想.感情.金钱.思想. 传统意义上,金钱才是财富 ,因为几千年来,只有金钱被所有人接受.而我认为,金钱只是物质财富的最佳代表.金钱可以与绝大多数的物质财富等价交换,但不能与精神财富等价交换. 人类社会,财富分3种:人.精神(理想.思想.感情等).物质(金钱等) . 人,人类社会的一切都是围绕"人" 在运作.要不然,为什么叫做"人类文明"呢.人是财富的拥有者,没有人,精神不复存在,金钱只是一堆废纸废铁. 精神,人类社会不断发展,最重要的一点

极米说要颠覆传统电视,它做得怎么样了?

又是一年618,这是剁手党的狂欢,更是各大商家亮肌肉比实力的秀场,智能硬件行业更是如此.作为智能微投行业的龙头企业,极米又完成了个大满贯.天猫交易指数显示,618全天,极米科技旗舰店交易指数遥遥领先,远超过同品类第二名和第三名.618开始疯狂两小时中,京东投影设备售出3万台,其中一半交易量来自极米. 图为天猫办公类别投影交易指数排名 图为京东618疯狂两小时战报 有趣的是其创始人兼CEO钟波之前喊出了"五年内,无屏电视将颠覆传统电视."的口号,而且在今年4月25日CCTV-1新闻联播上

我的投资、理財、財富观

財富是什么?我觉得是 人.理想.感情.金钱.思想. 传统意义上.金钱才是財富 .由于几千年来,仅仅有金钱被全部人接受.而我觉得,金钱仅仅是物质財富的最佳代表.金钱能够与绝大多数的物质財富等价交换,但不能与精神財富等价交换. 人类社会,財富分3种:人.精神(理想.思想.感情等).物质(金钱等) . 人,人类社会的一切都是环绕"人" 在运作.要不然,为什么叫做"人类文明"呢. 人是財富的拥有者.没有人.精神不复存在.金钱仅仅是一堆废纸废铁. 精神,人类社会不断发展.最重

作为运营新人,取标题的这10个小技巧你需要掌握

当我们一看到" 标题党 " 这三个字,不用多说,心里绝对都是坏的印象.一篇 shit 一样的文章,靠一个好的标题,是可以获得不错的点击量,但 内容运营 的最终目的是为了数据好看吗?起一个好的标题确实是一个文章能否获得关注和点击率的关键,但如何在不成为" 标题党 " 的前提下取 好标题呢?近日fansir 从内容运营大牛那收获良多,特来与大家分享些 10 个起好标题的小技巧. 需要特意声明下,我们在运用技巧时,一定要实事求是,标题一定要和文章内容有关,千万不要成为自己

2.5星|王煜全《学会洞察行业》:没看到独特的分析方法,思路不够清晰,缺乏洞察

学会洞察行业:写好分析报告的6堂实战课 看书名与全书的结构,作者尝试给出一套行业分析的方法.读后感觉就是投资圈常用的行业调查分析的一些检查清单.作者对这些清单的整理归类我认为思路不够清晰. 总体来说,全书讲行业调查方法论是比较失败的.作者也没给出具体的完整的行业调查分析的案例. 书中作者举了一些他们公司投资相关的美国科技创业公司的例子,还有点意思. 总体评价2.5星,价值不大. 以下是书中几张插图: 以下是书中一些内容的摘抄: 1:那么,如何判断一个产业是否已经成熟,或者产业机会是否来临呢?主要

从华为P20开始的脑洞之旅:AI如何改变未来手机生活

春天到来,跟万物一起萌生的,还有各式各样的手机新品- 相比去年的全面屏风潮,今年的手机市场可以说是AI的天下.各式各样不同等级的AI拍照满天飞.而华为P20系列的到来,又把移动AI这个话题拉升到了新的热度.比如说,基于麒麟970搭载NPU带来的AI专项处理能力,华为P2O首次实现了AI摄影大师系统,在摄影上带给了用户瞬间成为大师体验:而AIS智能防抖系统则利用了NPU提供的图像识别能力,对成像质量显著提升,解决了我们拍照和拍摄视频时手抖的问题.但是,可能更多消费者的印象中,AI是一个非常强大,类

最长上升子序列问题

描述 有一个长为n的数列a0,a1,…,an-1.求出这个序列中最长的上升子序列长度.上升子序列指的是对于任意的i < j,都满足ai < aj的子序列. 输入 n = 5 a = {4,2,3,1,5} 输出 3(a1,a2,a4构成的子序列2,3,5最长) 这个问题是被称作最长上升子序列的著名问题.这一问题通过DP也能很有效率地求解.我们首先建立递推关系: 定义dp[i]:= 以ai为末尾的最长上升子序列的长度 则,以ai结尾的上升子序列是 只包含ai的子序列,或者 在满足j < i

动态规划——最长上升子序列

问题 最长上升子序列是一类经典的动态规划问题. 给定N个数字, A1,A2,....An,从中选择k个数字 At1, At2,... Atk,满足 1 =< t1 < t2 < .. < tk <= n,且 At1 < At2 < ... < Atk,求满足要求的最大的k. 分析 设一个动归数组dp,dp[i]表示以第i个数字(即Ai)结尾的最长上升子序列的长度,显然这种问题的划分满足无后效性和最优子结构.同时,可以很方便的推出递推关系 dp[i] = ma