前言
人机交互简单来说,就是“人和机器打交道的方式”。人和计算机打交道根源于人类把计算机当成一种有效的计算服务工具。计算机自产生以来,计算能力日益强大,人类对计算机的态度也开始在计算机只是呆板的“机器”,还是可能变得像“人”一样聪明,甚至比人更聪明之间摇摆。这种模糊的态度伴随着计算机的进化不断演变。随着深度学习技术的崛起,进一步加速了这个进程。人与机器人指尖的交流也逐步从指令交流转向情感交流,而在这种交互的进化过程中,也伴随着一些难题与挑战。
百度为2018人工智能创意赛集训营邀请了百度AI交互设计院体验架构师李士岩,为你解答这些难题的解决方案。
机器人和人机交互体验需要重构
图一: 1921年捷克剧作家卡尔·恰佩克(Karl Capek)在名为《罗素姆万能机器人》(Rossums Universal Robot)的戏剧作品中创造了“robot”(机器人)这个名词。这个词源于捷克语的“robota”,意思是“苦力”。
机器人自从在人们想象中诞生的那天起承载了人类巨大的梦想,这个梦想是将人类从繁重的劳动中解放出来。人类的劳动从交通设计角度有两个部分,第一部分来自于人类与世界的交互,比如搬运;刷碗;洗衣服。第二部分来自于人与人的交互,比如心理辅导;讲故事;指路。机器人完成人类的梦想必须解决两个层面的交互问题,第一个机器人与世界的交互,第二个维度是机器人与人的交互。机器人与世界的交互严重的依赖科学和技术主导,目前这部分取得了长足的进步。用设计将技术转化为机器人类体验较好的交互方式是机器人与人的交互,而目前这部分依旧处于初级的水平。现在主要存在三个问题:
第一个问题是语音交互唤醒不够自然,每次的发出指令前必须有一个唤醒的方式,这样使得使用机器人的效率非常非常低,比如在家里面用支持语音的智能电视看电视的时候,要不停地通过唤醒输出指令。
第二个问题是机器人不关注人的情绪,经过试验我们发现当人交互的对象越接近于人的时候,人类越倾向于输出情绪和情感。比如人类会跟语音系统说你怎么这么笨,但是不会跟影子、茶杯这么说。人类有六种基本情绪,27种丰富情感,但是目前无论你有怎样的情绪,他不会在意你的情绪。
第三个问题是目前机器人依然不够主动。经过调研发现有85%的用户对机器人的主动交流有明确的期待,但目前机器人连怎样主动交流不知道。这三个问题使得用户逐步丧失了对机器人的信心,使得机器人不再具有很强的吸引力,这种情况下一定要重构机器人人机交互体验。所以今天跟大家介绍机器人自然情感任意交互模型。
Frequency Percent(%)
非常不需要 73 6
比较不需要 109 9
一般 393 32.5
比较需要 347 28.7
非常需要 287 23.7
Total 1209 100
表一:85%的用户对主动交流有期盼
自然情感语音交互模型
机器人自然语音交互模型是机器人使用传统的语音的原创交互模型,它具备三个维度:
第一个维度是唤醒。服务机器人与人进行交互的时候,大部分场景是镜像交互。所以我们设计了新的进场模型,第一个节点是距离检测,第二个节点是人脸锁定,第三个节点是唇动检测:检测到用户正在与机器人对话时,会自动开启语音交互的流程。
图二:近远场的唤醒检测方式
第二个维度用户的情绪应对模型,人机交互发展几十年里,机器人的IQ取得了巨大的进步,而机器人的EQ一直没有得到发展,而情感是人类的刚需。当两个产品的IQ差不多时,一个更具情商的产品一定是更具市场竞争力的。机器人的EQ包含两个部分,一部分情绪的识别,一部分情绪的应对。关于情绪的识别,我们用东方人的情绪面部数据进行训练的适合东方人的情感识别系统。比如你很开心的跟智能音箱说给我放一首歌和很悲伤的说跟我放一首歌结果应该是不一样的。
在附带情绪任务的悲伤场景下,机器人回馈的语音语调应该是具有同样的悲伤的情绪,而策略应该是先完成任务后安抚情绪。在负向情绪的化解这个维度,语音语调也是悲伤,但是策略是先安抚再引导任务。通过这种方式,我们能够使得机器从不关心人类的主观情感变成对每一种情感都有个性化应对方式,这种策略可以赋予机器情商。
图三:赋予机器情商的方式
第三个维度是机器人的主动交流模型,主动交流的难度在三点。1. 要根据场景,语气程度和会话形式,而什么场景下机器要主动交流,并且不侵犯用户的隐私。主动交流到什么程度也是一个值得考虑的问题,过分主动的机器人往往会给用户造成干扰,而完全不主动的机器人,通常让用户觉得不够智能。通过试验发现家庭场景中更适合主动交流,而公共办公场景下会不一样,所以主动交流的程度是和用户的注意力承负相关关系。并且表达方式和场景有密切的关系,所以每个场景下主动交流的方式是不一样的。
图四:主动交流的程度是和用户的注意力承负相关关系
通过一系列的设计我们可以为机器由被动接受指令到主动交流指名一个方向。在百度的NIRO(Nature Language · Initiative Interaction · Emotion Reflection · Origin Models)中每个模型分为三个层次,人类情景包括识别层、策略层和表现层,机器人主动交流模型包括输入层、策略性和主动层。服务机器人另外一个在行业内重大的问题是怎样让服务机器人低成本的进入到广域智能,机器人的生存环境是人类的生存环境。比如打开一个门,进入并操作一个电梯,清理一个障碍物对人类很容易,但是对机器人非常难。目前的解决方案把大厦里每一个门换成电动的门,一扇电动门可以跟机器人系统进行数字交互。若想让机器人清理障碍物,需要给机器人安装昂贵的机械手臂,这些情景都阻止了机器人向真正的广域场景和大规模的应用。那我们的解决方式是什么?我们的答案最佳方式是协同智能。
协同智能
协同智能的时代是非常美好的,在未来机器低成本的,利用NIRO人机交互的设备,可以让机器人产品快速进入智能时代。在科技发展每一个阶段,都会出现一些代表性的产品,比如PC可以作为游戏机、打字机,比如手机可以作为指南针、MP3、照相机,而在人工智能时代我们认为这个产品是机器人。机器人与前者们出现的逻辑极其相似,都是以技术为基础,并且通过技术设计人机交互模型,将人机交互模型应用到更多产品。比如说应用了触屏的技术,打造了交互模型,将交互模型应用到平板电脑、手机、桌面型的设备才造成移动端的繁重。人机交互模型的设计需要不仅仅是技术,还有创意,现在AI技术有了大的技术的提升,这部分更需要创意和技术融合在一起。
图五:Niro可以给机器赋能协同智能
----实录结束----
李士岩
百度AI交互设计院体验架构师。曾主导百度智能路由器、百度智能家居操作系统、Duwear智能手表人机交互系统、Jarvis智能语音管家等产品的人机交互设计,拥有多个世界和中国发明、外观专利。2017年加入百度AI交互设计院从事交互模型的创新、标准制定等工作。
原文地址:http://blog.51cto.com/13970240/2292333