人机交互,加速机器人拟人化

前言
人机交互简单来说,就是“人和机器打交道的方式”。人和计算机打交道根源于人类把计算机当成一种有效的计算服务工具。计算机自产生以来,计算能力日益强大,人类对计算机的态度也开始在计算机只是呆板的“机器”,还是可能变得像“人”一样聪明,甚至比人更聪明之间摇摆。这种模糊的态度伴随着计算机的进化不断演变。随着深度学习技术的崛起,进一步加速了这个进程。人与机器人指尖的交流也逐步从指令交流转向情感交流,而在这种交互的进化过程中,也伴随着一些难题与挑战。
百度为2018人工智能创意赛集训营邀请了百度AI交互设计院体验架构师李士岩,为你解答这些难题的解决方案。

机器人和人机交互体验需要重构


图一: 1921年捷克剧作家卡尔·恰佩克(Karl Capek)在名为《罗素姆万能机器人》(Rossums Universal Robot)的戏剧作品中创造了“robot”(机器人)这个名词。这个词源于捷克语的“robota”,意思是“苦力”。
机器人自从在人们想象中诞生的那天起承载了人类巨大的梦想,这个梦想是将人类从繁重的劳动中解放出来。人类的劳动从交通设计角度有两个部分,第一部分来自于人类与世界的交互,比如搬运;刷碗;洗衣服。第二部分来自于人与人的交互,比如心理辅导;讲故事;指路。机器人完成人类的梦想必须解决两个层面的交互问题,第一个机器人与世界的交互,第二个维度是机器人与人的交互。机器人与世界的交互严重的依赖科学和技术主导,目前这部分取得了长足的进步。用设计将技术转化为机器人类体验较好的交互方式是机器人与人的交互,而目前这部分依旧处于初级的水平。现在主要存在三个问题:
第一个问题是语音交互唤醒不够自然,每次的发出指令前必须有一个唤醒的方式,这样使得使用机器人的效率非常非常低,比如在家里面用支持语音的智能电视看电视的时候,要不停地通过唤醒输出指令。
第二个问题是机器人不关注人的情绪,经过试验我们发现当人交互的对象越接近于人的时候,人类越倾向于输出情绪和情感。比如人类会跟语音系统说你怎么这么笨,但是不会跟影子、茶杯这么说。人类有六种基本情绪,27种丰富情感,但是目前无论你有怎样的情绪,他不会在意你的情绪。
第三个问题是目前机器人依然不够主动。经过调研发现有85%的用户对机器人的主动交流有明确的期待,但目前机器人连怎样主动交流不知道。这三个问题使得用户逐步丧失了对机器人的信心,使得机器人不再具有很强的吸引力,这种情况下一定要重构机器人人机交互体验。所以今天跟大家介绍机器人自然情感任意交互模型。
Frequency Percent(%)
非常不需要 73 6
比较不需要 109 9
一般 393 32.5
比较需要 347 28.7
非常需要 287 23.7
Total 1209 100
表一:85%的用户对主动交流有期盼
自然情感语音交互模型
机器人自然语音交互模型是机器人使用传统的语音的原创交互模型,它具备三个维度:
第一个维度是唤醒。服务机器人与人进行交互的时候,大部分场景是镜像交互。所以我们设计了新的进场模型,第一个节点是距离检测,第二个节点是人脸锁定,第三个节点是唇动检测:检测到用户正在与机器人对话时,会自动开启语音交互的流程。


图二:近远场的唤醒检测方式
第二个维度用户的情绪应对模型,人机交互发展几十年里,机器人的IQ取得了巨大的进步,而机器人的EQ一直没有得到发展,而情感是人类的刚需。当两个产品的IQ差不多时,一个更具情商的产品一定是更具市场竞争力的。机器人的EQ包含两个部分,一部分情绪的识别,一部分情绪的应对。关于情绪的识别,我们用东方人的情绪面部数据进行训练的适合东方人的情感识别系统。比如你很开心的跟智能音箱说给我放一首歌和很悲伤的说跟我放一首歌结果应该是不一样的。
在附带情绪任务的悲伤场景下,机器人回馈的语音语调应该是具有同样的悲伤的情绪,而策略应该是先完成任务后安抚情绪。在负向情绪的化解这个维度,语音语调也是悲伤,但是策略是先安抚再引导任务。通过这种方式,我们能够使得机器从不关心人类的主观情感变成对每一种情感都有个性化应对方式,这种策略可以赋予机器情商。

图三:赋予机器情商的方式
第三个维度是机器人的主动交流模型,主动交流的难度在三点。1. 要根据场景,语气程度和会话形式,而什么场景下机器要主动交流,并且不侵犯用户的隐私。主动交流到什么程度也是一个值得考虑的问题,过分主动的机器人往往会给用户造成干扰,而完全不主动的机器人,通常让用户觉得不够智能。通过试验发现家庭场景中更适合主动交流,而公共办公场景下会不一样,所以主动交流的程度是和用户的注意力承负相关关系。并且表达方式和场景有密切的关系,所以每个场景下主动交流的方式是不一样的。

图四:主动交流的程度是和用户的注意力承负相关关系
通过一系列的设计我们可以为机器由被动接受指令到主动交流指名一个方向。在百度的NIRO(Nature Language · Initiative Interaction · Emotion Reflection · Origin Models)中每个模型分为三个层次,人类情景包括识别层、策略层和表现层,机器人主动交流模型包括输入层、策略性和主动层。服务机器人另外一个在行业内重大的问题是怎样让服务机器人低成本的进入到广域智能,机器人的生存环境是人类的生存环境。比如打开一个门,进入并操作一个电梯,清理一个障碍物对人类很容易,但是对机器人非常难。目前的解决方案把大厦里每一个门换成电动的门,一扇电动门可以跟机器人系统进行数字交互。若想让机器人清理障碍物,需要给机器人安装昂贵的机械手臂,这些情景都阻止了机器人向真正的广域场景和大规模的应用。那我们的解决方式是什么?我们的答案最佳方式是协同智能。
协同智能
协同智能的时代是非常美好的,在未来机器低成本的,利用NIRO人机交互的设备,可以让机器人产品快速进入智能时代。在科技发展每一个阶段,都会出现一些代表性的产品,比如PC可以作为游戏机、打字机,比如手机可以作为指南针、MP3、照相机,而在人工智能时代我们认为这个产品是机器人。机器人与前者们出现的逻辑极其相似,都是以技术为基础,并且通过技术设计人机交互模型,将人机交互模型应用到更多产品。比如说应用了触屏的技术,打造了交互模型,将交互模型应用到平板电脑、手机、桌面型的设备才造成移动端的繁重。人机交互模型的设计需要不仅仅是技术,还有创意,现在AI技术有了大的技术的提升,这部分更需要创意和技术融合在一起。

图五:Niro可以给机器赋能协同智能
----实录结束----

李士岩
百度AI交互设计院体验架构师。曾主导百度智能路由器、百度智能家居操作系统、Duwear智能手表人机交互系统、Jarvis智能语音管家等产品的人机交互设计,拥有多个世界和中国发明、外观专利。2017年加入百度AI交互设计院从事交互模型的创新、标准制定等工作。

原文地址:http://blog.51cto.com/13970240/2292333

时间: 2024-10-30 17:14:35

人机交互,加速机器人拟人化的相关文章

人工智能和 5G 技术共同助力机器人进入4.0时代

近日,英特尔.达闼科技.新松机器人.科沃斯商用机器人共同发布了<机器人 4.0 白皮书 --云-边-端融合的机器人系统和架构>.机器人技术发展主要阶段分析2017年,中国信息通信研究院.IDC 国际数据集团和英特尔共同发布了<人工智能时代的机器人 3.0 新生态>白皮书,其中把机器人的发展历程划分为三个时代,分别称之为机器人1.0.机器人 2.0.机器人 3.0.机器人 1.0(1960-2000),机器人对外界环境没有感知,只能单纯复现人类的示教动作,在制造业领域替代工人进行机械

(转)深度学习前沿算法思想

深度学习前沿算法思想 本文转自: https://mp.weixin.qq.com/s?__biz=MzA5NDExMTAzNA==&mid=2649981646&idx=2&sn=8fe05eac5a5068efb65ca1602e5fd3a0&chksm=8854b69bbf233f8db5dbaa1ea8396d181c9a35e760ab3c1c4934b504f69fe92683972d78d327&mpshare=1&scene=2&sr

人机交互的新方向:智能聊天机器人

老网民肯定还记得263聊天室.QQ聊天室,火爆的聊天场景,充满好奇的人们聚一个虚拟的小房间里畅所欲言,不断地发出欢声笑语.那时候,有一些特别可爱的AI聊天机器人,简单的回复你几句,给你讲几个笑话,发几张美女,贴几条新闻……虽然简单,但那么真诚.可爱,像一个初生的小宝宝,给我们留下无限纯真和美好的回忆. IM出现&盛行之后,有msn聊天机器人接棒,也有QQ自动应答机器人轻舞飞扬……直到8年后的某一天,苹果第一次引入Siri,才全新定义了“智能聊天机器人”.据百度百科记录,“Siri可以令iPhon

人机交互智能问答机器人的实现

人机交互智能问答机器人,这句话所包含的信息量和技术过于庞大,这里为大家进行拆分解释,并以图灵机器人平台为例,通俗的介绍其技术实现原理. 第一,人机交互.在计算机专业术语中,是指系统和用户(人)之间的交互关系.系统可以是各种各样的机器,也可以是计算机化的系统和软件.通常我们把人们可见的部分称作人机交互界面,比如计算机的显示器.鼠标和键盘,飞机操控中的各种按钮和仪表盘等.淡然,人机交互并不只是人机交互界面,它既包含如何让人更好的理解和操控各种系统,又包含如何提高各种系统的可用性和友好性.人机交互在我

RPA财税机器人:加速企业财税智能化转型的关键

当前,人工智能(AI).机器人流程自动化(RPA)的发展,给财税领域带来了新的机遇与挑战.RPA的到来,势必会加速企业财务的智能化转型.财税领域面临的痛点所有企业都面临着成本控制,生产力提高的压力.在许多企业的财务部门中,类似纳税申报.增值税发票开具.发票验真以及涉税会计入账等工作的执行,通常需要大量人力和时间去处理.这为RPA的实施提供了用武之地.特别是那些纳税主体较多的集团型企业,由于纳税申报的数据来源不同(例如来自财务信息系统.开票软件等),手工操作量极大.实际上,RPA旨在减少人工对于系

python 调用图灵机器人api实现简单的人机交互

接入流程如下,需要先注册开发者帐号,之后会得到一个32位的key,保存下来,用于以后发送数据.http://www.tuling123.com/ 请求方式 示例: # -*- coding: utf-8 -*- import urllib import json def getHtml(url): page = urllib.urlopen(url) html = page.read() return html if __name__ == '__main__': key = '8b005db5

E-PUCK机器人-PC人机交互界面

为了使用方便,E-PUCK团队开发了一个在计算机上运行并通过蓝牙连接到e-puck的接口,该接口基于先进的sercom协议(选择器3); 通过该界面,可以获得有关所有传感器的信息,接收摄像机图像并控制LED和电机. 源代码可从以下链接获得: 多平台版本3.0(Monitor3.0源代码); 该应用程序是一个Qt项目,因此可以使用Qt Creator轻松处理编译; 或者可以使用qmake. 以下可执行文件是动态编译的,因此必须在系统中安装Qt库(4.5.0或更高版本)才能运行它们: Linux可执

ROS探索总结(十六)——HRMRP机器人的设计

1. HRMRP简介 HRMRP(Hybrid Real-time Mobile Robot Platform,混合实时移动机器人平台)机器人是我在校期间和实验室的其他小伙伴一起从零开始设计并开发的一款机器人平台,其中大部分扩展电路.驱动和ROS相关的底层功能都是我们自己做的.该机器人平台具有软硬件可编程.灵活性强.模块化.易扩展.实时性强等特点,机器人的整体结构如下图所示. HRMRP具备丰富的传感器和执行器,在该平台的基础上,我们设计并实现了机器人SLAM.自主导航.人脸识别.机械臂控制等功

智能语音人机交互产业链及关键技术分析

人机交互是一门计算机科学,主要研究关于设计.评价和实现供人们使用的交互计算系统以及相关现象的科学.人机交互的发展经历了以下几个阶段:手工作业阶段.作业控制语言与交互命令语言阶段.图形用户界面(GUI)阶段.网络用户界面,目前已经发展到多通道.多媒体的智能人机交互阶段.其中,语音人机交互是当前多通道.多媒体智能人机交互的主要方式.特别是苹果Siri.科大讯飞语点的出现,让智能语音人机交互技术实现了新的跨越,得到了社会各界的广泛关注. 一.智能语音人机交互产业发展现状 什么是智能语音人机交互技术?简