深耕技术,沉淀场景,迭代产品,科大讯飞逐步展现着破局与进阶的AI魄力。
“讯飞阅读”——一个能快速、便捷、完美复刻你声音的平台,是有声小说阅读神器,科大讯飞的新武器。
如果说2015年是人工智能的概念年,2016年是其蛰伏期,那么2017和2018必然是人工智能的落地元年。
近日,科大讯飞的半年报逐渐被披露,企业上半年营收32.1亿,同比增长了52.68%,毛利16.02亿,同比增长了56.02%。
稳中有升的毛利率中,这家人工智能的龙头企业逐步展现着自己极强的竞争力。
深耕技术,沉淀场景,迭代产品,科大讯飞逐步展现着破局与进阶的AI魄力。
科大讯飞从成立之初就坚定了智能语音这一领域,19年坚持源头技术创新才能研发出讯飞阅读这样的产品。同时,讯飞阅读的合成系统借鉴了国际语言合成大赛(科大讯飞连续13年蝉联该项大赛冠军)的评测标准,如:相似度、自然度、错误率、段落总体感觉等。
讯飞的语音合成技术从声音角度实现了“分身特技”,在录入对应的语料后,通过训练成音库就能复刻不同的声音。
“讯飞阅读”将打破传统的阅读行业现状,通过科技引领阅读行业新形态。
一、刷屏“讯飞阅读”的背后逻辑
上世纪末,IBM出了一款叫做IBM VIAVOICE的软件,这个软件可以实现语音到文字的识别和转化,在网络资源匮乏的当时,不禁令人眼前一亮。
但100年后的今天,这种技术对于科大讯飞来说只属于入门级别。
近日,一款名为‘“声音复刻”黑科技,让你秒变智能主播’的讯飞阅读产品刷爆朋友圈,一时风光无两,产品背后的语音识别系统更是令人高呼过瘾,其本质的逻辑并不难解,可简单概括为以下三点:
- 充分满足用户痛点。随着消费的不断迭代,人们对于阅读产品个性化的呼声越来越高,以来获得不同的、独特的、有品的阅读体验,而讯飞这款产品充分把握住人性的HIGH点,在10句话完成自己专属阅读器定制后,人人都可以收获自己的专属阅读器。
- 智能化程度高。通过10句话的论调,用户的参与门槛低,易于接受,使用者的产出比极高,同时在首页有可视化的操作方式和文本,可直接转化和进行下一步操作。
- 市场接受度广。经朋友圈刷屏验证,用户的可接受度广,产品附加价值高,页面整洁大气,传播路径较为清晰,用户定位明确,具有足够的市场和群众基础。
而这款黑科技被刷屏的根本原因就在于,科大讯飞的核心业务之一——语音合成技术已然达到甚至超越国际先进水平。
在近期举办的国际语音合成大赛BLIZZARD CHALLENGE中,讯飞的语音识别技术得到全世界的认可,在10个测评项目中斩获9项第一,其中在最关键的自然度和相似度评测指标上更是大幅领先第二名,成为国际人工智能市场的先头兵。
除此之外,医疗影像、机器阅读理解同样是其深耕场景。一组数据显示,医疗影像技术的逐渐成型对于糖网病等早期易治疗的疾病发病率具有明显的抑制,微像识别为医疗诊断提供了更为可靠的保障和依据。
同时,在今年1月在斯坦福大学发起的SQUAD机器阅读理解挑战赛中,讯飞提出的交互式层叠注意力模型(INTERACTIVE AOA READER)同样惊艳全场,F1(模糊匹配率)与EM(精确匹配率)在全场测试中更是拔得头筹。
“在这个时代,人工智能不再是概念,应用是硬道理。“科大讯飞董事长刘庆峰说道。
个性化场景深耕,多元化布局,专注C端业务,重点赛道建设,科大讯飞成功跑赢了市场。
是常年在外务工不能陪在孩子身边的父母,讯飞阅读可以复刻我们的声音,为远在家乡的孩子讲故事,让你的声音陪伴他们入眠;
在异国的游子,你的声音可以为空巢的父母读书、读报;
在外拼搏的职场新人,可以用妈妈的声音每天准时叫你起床,提醒你天气变化需添衣带伞;
开车时,车载导航系统里,是你的妻子、孩子的声音为你保驾护航,提醒你安全驾驶,早些回家;
宝宝在成长过程中的每一次声音变化都能被复刻和保存,让他们长大成人后不忘童真……
这一切都秉承了科大讯飞用顶天的技术践行“科技以人为本”的关怀,也体现了讯飞阅读的品牌主张——复刻声音,美好常伴。
二、“讯飞阅读”引领阅读行业新形态
手机阅读现在变得越来越时尚,手机阅读软件哪个好用以及手机阅读器下载成为很多人关注的。掌阅相当于手机阅读的1.0时代,满足了用户阅读基础功能版本。QQ阅读这类产品更像手机阅读的2.0时代,内容丰富,更新快。相比掌阅,QQ阅读,讯飞阅读更像是引领阅读行业的3.0产品。
现在人们追求的不是因为它阅读起来非常方便,也不仅仅是内容丰富,更新快,目前几乎所有的手机阅读产品内容都很丰富,而哪款产品给用户带来的新形态则显得尤为重要。
讯飞阅读可以看听融合,无缝切换,阅读场景随意变,此外讯飞阅读还提供AI智能主播,流畅自然,多种语言任人选。全球首创声音定制,用自己的声音,为TA读书。
此前,微信阅读基于微信的大生态火爆一时,随后数据也并不乐观,按照排名第十的当当读书370万季度活跃用户的规模推算,微信读书的数据并不太乐观。
互联网时代最明显的标志是多维度、跨领域,全阶层,而随着用户需求的不断迭代,依托于用户的智能技术也同样需要升级改造。
目前,据相关数据显示,讯飞阅读的下载量已经突破4000多万,值得一提的是讯飞阅读用户中学生占比率高达48.8%。代表互联网新生代的学生们,他们都喜欢这样带有黑科技属性的产品,极致的用户体验让讯飞阅读引领着阅读行业的新未来。
三、“讯飞阅读”的AI大平台逻辑
17年十月份锤子科技发布会上,老罗专门插播了一条讯飞输入法的广告。
自此讯飞一战成名,之后短短的几天内讯飞输入法获得了上千万人次下载,智能化、人性化、专业化成为讯飞输入法使用人群出现频次最高的评价。
海纳百川,有容乃大。作为人工智能的领军者,科大讯飞同样肩负着建设平台、催动行业进步的责任和使命。
赋能项目方,开放AI技术给第三方,打造国内人工智能大平台,这是科大讯飞坚持并时刻践行的方向。
截止今年,其孵化的第三方创业团队已经到了80万,日均使用次数从一年前的37亿次增长到46亿次,累计终端数不断增加,平台效应初显。
2017年11月,科技部召开新一代人工智能发展规划暨重大科技项目启动会,对我国的人工智能产业进行了初步分工和布局。会议宣布首批国家新一代人工智能开放创新平台名单:依托百度搞自动驾驶,依托阿里搞城市大脑,依托腾讯搞医疗影像,依托科大讯飞搞智能语音。
讯飞阅读这次作为科大讯飞的新武器,或是全世界第一个应用级、也是普通用户所能体验到的最便捷、最成熟的个人音库定制产品。在同类产品大多还处于宣贯概念或早期原型阶段时,科大讯飞就创造性地将工业级解决方案精简成普通消费者能体验和应用的软件。
现阶段讯飞阅读只需要自己录入10句话,5分钟左右就可以制作完整音库,样本量和制作时间已经远远低于同类型产品。
未来,讯飞或许就能打磨出只需要用户录制1句话就能生成音库的产品。
原文地址:http://blog.51cto.com/13934481/2301351