局部战争还是全面入侵?如何看待搜狗录音翻译笔?

科技产品的更新换代频率之快,差不多是每个人都能感受到的。但在极速迭代的硬件大潮中,有没有产品技术陷入停滞,仅仅依靠市场刚需维持增长速度的电子产品呢?其实仔细找找就会发现,这样的产品还非常多。比如说我们的媒体同行、商务人士和学生党的标配,走到哪都要带着的录音笔,就是这样一个例子。

我们能看到的是,中国市场的录音笔每年保持着百万台级别的销售量,但录音笔本身的功能更新却近乎空白,新产品仅仅依靠价格、待机时间、收音效果来保持增长。这种不用快跑也能生存的硬件市场之所以存在,是因为刚需直接催生了市场份额。录音笔产品虽然看似不大,但却是很多生活、工作、学习场景所中不可替代的工具。无论是记者采访、秘书整理会议纪要,还是学生完成学业工作,都无法用其他工具来代替录音笔。久而久之,就把这个重要但不起眼的市场变成了真空地带,以至于大家似乎都忘记了录音笔这东西也是能进行科技创新的——但AI并没有忘记它。

刚刚,搜狗推出了录音翻译笔,这款产品刚一面世就引来了巨大关注。其原因很容易理解,因为搜狗的录音翻译笔,在价格与其他录音笔持平甚至更低价的前提下,居然增加了速记、翻译、同传这些原本非常昂贵的新功能。知乎上有用户说,这简直直接推翻了购买传统录音笔的必要性,就连马化腾都在第一时间下单抢购了一台。

但在一个产品之外,我们似乎可以看到更多。录音笔仅仅是个小的硬件场景,或者说只是个开始。AI带来的机器翻译、语音识别等功能,会不会将在完成AI+录音笔后,进行模式复制,一个又一个地去推翻我们熟悉的场景,走入更智能的时代?

这么看来,搜狗录音翻译笔的背后,或许不仅是一场单一科技硬件的局部战争,更隐藏着一场山雨欲来的AI全面入侵。这就很有可以开脑洞的地方了…

推翻已有产品的全部价值,才能创建新入口:录音笔的闪点狙击

在进行录音笔的推理前,我们不妨思考这样一个问题:今天大家还能看到带按键、连蓝牙的“智能音箱”吗?好像不太现实,即使路边摊扫码就送的音箱,如今也基本是语音交互的AI音箱了。从亚马逊推出Echo,到国内BAT、京东等公司争相进入音箱市场,再到华强北数千家工厂开工做AI音箱,短时间对话式交互、能够指挥智能家居、连接电商的音箱产品笼罩了整个中国。之所以会出现这种现象,是因为在AI带来的交互改变面前,传统蓝牙音箱已经失去了所有价值:价格不便宜、音质都一样、功能不及新音箱的十分之一。这种情况下,谁还会留恋此前的音箱产品呢?整个产业也瞬间抛弃了过去。

同样的颠覆故事,今天似乎开始在录音笔身上上演。我们知道,大多数录音笔的功能仅仅是录音和播放,稍微智能点的也就是加上上传到云端。这功能确实寡淡,但也无法被手机等硬件取代。不能取代,却不代表无法颠覆。假如新的硬件形态保留了原有硬件的价格和功能,又加入了全新的功能,岂不是马上“改朝换代”?尤其是在新功能足够重要的情况下。

比如说,同时具有速记、翻译和同传能力的录音笔。搜狗的录音翻译笔的价值就在于此。基于搜狗AI带来的语音识别、NLP和机器翻译能力,这款产品集成了速记、同传等十分重要,但录音笔无法实现的功能。

比如说,搜狗录音翻译笔支持同声传译 3 秒上屏显示。将录音翻译笔与手机连接,即可在手机端 APP 查看实时的语音识别结果与翻译结果,并可直接保存和分享录音及同传文件。

换句话说,在用录音笔收到一段英文之后,用户可以马上就得到三件东西:录音、这段录音的文字整理、这段录音的翻译结果。

如果时间倒回到不久之前,一名记者采访了位外国人。整个从整理文档到翻译内容需要多久呢?大约是一个通宵,而在搜狗录音翻译笔出现后,大约不需要时间。据了解,目前搜狗录音翻译笔支持中英与英中同传,语音识别准确率中文 97%,英文 95%。基于搜狗的神经网络机器翻译技术,同传翻译准确率达 90%,基本可以支持跨语种实时对话的需要。而其将录音转化成文字,最快可以支持400 字每分钟,也可以说是非常高效。人工同传和同传设备的价格之昂贵,是大家都知道的。商用的机器同传也只是企业们能用得起。而搜狗这次竟然推出了价格398元的完全面向普通消费者的录音笔。毫无疑问,用户在新购买一只录音笔的时候,已经不需要做什么选择了。要知道,录音笔从前仅仅提供的是一种工具,而在可以完成速记识别、录音翻译和同声传译功能之后,录音笔更多是在为用户提供此前必须依靠人力才能获得的服务。AI的奇妙之处或许正在于此。通过将经验和识别能力压缩成硬件能力,一场录音笔市场的闪点狙击就此完成。

但在录音笔战役之外,或许我们能看到这场战争还远远没有结束。

翻译是硬件的命门所在:搜狗的区域战争

通过搜狗翻译录音笔的产品功能,我们会发现这样一个现象:可搭载在硬件上,快速准确的翻译能力成为了产品的一个价值驱动点。在全球化的今天,人们对跨语言表达和获取信息的需求也越来越高,产品的翻译能力会成为影响用户消费的重要因素。

而且,翻译能力是一个办公、社交、商务、旅行场景中会反复用到的能力,用户对翻译的需求往往是随时随地产生的。而传统的硬件系统中,因为受限于语音识别和机器翻译技术的准确率,加上硬件研发的不配套,我们很少能够在硬件上看到翻译、甚至同传这类的能力方案。但从搜狗此前推出的旅行翻译宝,再到如今的搜狗翻译录音笔,我们可以看到搜狗的“翻译+硬件”正在形成一个赋能公式,一个个打开垂直硬件生态的新商业空间。在世界化飞快演进的今天,对泛在化翻译的渴求很快会变成科技产品的命门。从搜狗的硬件思路中,我们可以看到翻译能力成为了其硬件的枢纽和市场通行证,把底层的AI技术和尖部的硬件场景联系到一起,组成了完整可复制的硬件解决方案。再观察搜狗从文字翻译、对话翻译、图像翻译到首家实现同传在消费级产品上的落地,搜狗的翻译之路正越走越快。

或许有理由相信,接下来占据“翻译+”这个优势的搜狗,会进驻和颠覆更多硬件独立场景。完成从软件到硬件的区域战争,将AI技术落地带到更多战场上。而隐藏在“机器翻译方案+硬件生态”背后的,是搜狗AI技术壁垒的不断加固与转化。

作为能源的AI,可能准备好了打一场世界大战

抽离到更高层级,我们可以看到硬件和软件的产品之上,是搜狗正在基于机器翻译、语音识别、NLP、知识图谱等世界领先的技术积累,源源不断构建垂直解决方案,将能力输送到一个又一个硬件和软件场景中。在这背后,是技术壁垒的红利持续发酵。

举例来说,搜狗语音输入日频次高达3.6亿次,其基于T级海量输入法文本数据使用神经网络进行建模,语音识别率高达97%,保持着目前的世界记录。而在机器翻译领域,搜狗在去年的AI顶级赛事WMT2017中获得了中英机器翻译冠军,并获得主要机器指标BLEU第一名。

对AI技术的持续探索和积累,尤其是基于语音与语言的AI技术体系,比如NLP、语音识别、机器翻译、词意分割等等,正在构成相互间紧密联系的AI技术引擎。更重要的是,在AI渗透到各垂直市场的档口,由于搜狗掌握了整个技术到产品的IP流程,不需要支付高昂的使用费用,这也让搜狗可以快速以消费级姿态切入各细分场景。以AI作为能源,调用多种能力组合创造新物种,可以看做这个时代的一场无限迭代。而搜狗已经开始了这场面向未来的探索。整个社会都在讲AI作为能源,而从录音笔从工具到服务的个案上可以看出,搜狗已经启动了AI作为能源的垂直场景进驻之旅。

下一个被颠覆的硬件是什么,或许才是我们今天应该感兴趣的话题。

原文地址:http://blog.51cto.com/naojiti/2117729

时间: 2024-08-01 22:12:14

局部战争还是全面入侵?如何看待搜狗录音翻译笔?的相关文章

搜狗翻译宝成为官方指定翻译机

Linux系统技术交流QQ群(3859061)验证问题答案:刘遄 10月21日,全球最大规模电子产品采购展--环球资源移动电子展在香港圆满闭幕.搜狗翻译宝Pro作为官方指定翻译机凭借42种语言翻译.离线翻译.拍照翻译等多项丰富实用的功能和时尚靓丽的外观设计,在为期4天的展会中脱颖而出,不仅吸引了大量参会者前来体验,更收获众多国际采购商的一致好评,成为全场最受关注的焦点之一. 作为全球科技创新的风向标,本次环球资源移动电子展涵盖智能手机.平板电脑.可穿戴产品.移动电子配件.AR/VR.智能翻译硬件

巨头纷纷押注的智能翻译机,会是第一款成功的消费级AI硬件吗?

到了今天,已经很少有人再提人工智能音箱了.使用率低.售价跳水.缺乏销售数据--我们不能武断地说智能音箱凉了,但的确不少所谓的AI企业的硬件梦碎了. 相对于一些盲目涌入AI的公司,一些科技公司似乎找到了另外一条硬件路--翻译机.科大讯飞推出了晓译翻译机.谷歌推出了实时翻译耳机,搜狗也在最近推出了搜狗旅行翻译宝和搜狗速记翻译笔. 开始呈现扎堆趋势的智能翻译机,是否会颠覆智能音箱成为下一个AI硬件浪潮? 打败大魔王,AI消费级硬件当务之急是走出手机的阴影 我们可以先从智能音箱的前车之鉴来看,智能翻译机

演示使用Metasploit入侵Windows

我使用Kali Linux的IP地址是192.168.0.112:在同一局域网内有一台运行Windows XP(192.168.0.108)的测试电脑. 本文演示怎么使用Metasploit入侵windows xp sp3. 启动msfconsole: # msfconsole 选择一个漏洞: msf > search platform: windows xp sp3 exploit/windows/smb/ms08_067_netapi是08年发现的漏洞,等级Great. 查看某个漏洞的详细信

深入探究Windows平台客户端安全问题-进程地址空间入侵和白加黑高阶利用

标 题: 深入探究Windows平台客户端安全问题-进程地址空间入侵和白加黑高阶利用 时 间: 2014-09-08,00:03:51 前言 为了避免被读者骂"标题党",笔者在文章开头先澄清一下这个高大尚的"进程地址空间入侵"的可替代词语-注入. 看完第一句还能看到这里的读者一般有两种:1.初学者,实在是不懂所以需要学习的同学 2.大牛,只是想看看笔者打算怎么来炒"注入"这盘冷饭. 好吧,如很多人都知道的一样,Windows平台下的远程模块&qu

搜狗语音云开发入门(二)——使用离线语音识别服务

1 简介 之前在<搜狗语音云开发入门--移动端轻松添加高大上的语音识别>中介绍了使用搜狗语音云为客户端程序添加在线语音识别服务.在线语音服务需要联网使用,但是你不能指望用户拥有完美的环境,事实上大多数情况下用户的外围环境都会有所限制.有的时候没有Wi-Fi.没有流量,还想使用语音识别,如果你给用户一个提示"您没开流量..."只能说你的程序弱爆了.有条件情况下给用户提供完美的服务,没有条件创造条件服务质量依然完美,并且清风徐来了无痕迹,这才是完美应用的体现.你不是用户的亲戚朋

kali linux 入侵window实例

我使用Kali Linux的IP地址是192.168.0.112:在同一局域网内有一台运行Windows XP(192.168.0.108)的测试电脑. 本文演示怎么使用Metasploit入侵windows xp sp3. 启动msfconsole: # msfconsole 选择一个漏洞: msf > search platform: windows xp sp3 exploit/windows/smb/ms08_067_netapi是08年发现的漏洞,等级Great. 查看某个漏洞的详细信

排查Linux机器是否已经被入侵

随着开源产品的越来越盛行,作为一个Linux运维工程师,能够清晰地鉴别异常机器是否已经被入侵了显得至关重要,个人结合自己的工作经历,整理了几种常见的机器被黑情况供参考 背景信息:以下情况是在CentOS 6.9的系统中查看的,其它Linux发行版类似 1.入侵者可能会删除机器的日志信息,可以查看日志信息是否还存在或者是否被清空,相关命令示例: [[email protected] ~]# ll -h /var/log/* -rw-------. 1 root root 2.6K Jul 7 18

通过服务监控手机呼叫状态并进行录音

两个服务互相守护 <LinearLayout xmlns:android="http://schemas.android.com/apk/res/android" xmlns:tools="http://schemas.android.com/tools" android:layout_width="match_parent" android:layout_height="match_parent" android:or

网络入侵检测

netstat -anlp | grep 80 | grep tcp | awk '{print $5}' | awk -F: '{print $1}' |sort | uniq -c | sort -nr | head -n20 netstat -ant | awk '/:80/{split($5,ip,":");++A[ip[1]]} END {for(i in A) print A[i],i}'  | sort -rn | head -n 20 tcpdump -i eth0 -