中文的“人机交互”翻译为英语有三种方式,对应3种不同的概念。第一种翻译是Hunlan— Machine Interaction(人一机器交互);第二种翻译是Human— Computer Interaction(人一计算机交互);第三种翻译是Human— Robot Interaction (人一机器人交互)[8]。本文中所说的“人机交互”是指人一机器人交互,它是研究如何让人与机器人更加了解对方、更加默契配合的技术。人—计算机交互是人—机器交互在计算机领域的延伸。同时,人一机器人交互主要是通过人一计算机交互完成的。所以,三者并不是互斥的概念,而是相互交叉紧密联系的概念。对前俩个概念的深入理解对设计良好的人—机器人交互系统很有帮助。60129
早期的人机交互系统
早期的人机交互的设计,主要借助人体工程学知识。关注的是机器和系统的物理特性,以及这些物理特性影响用户的表现[1]。具体来说,重点放在显示器、控制器等物理器件的尺寸和布局设计上。因此这个时期又被称作“旋钮和表盘时代”[10]。如今,这种人机交互技术仍在工业领域广泛应用。由于这种交互方式下的控制器按钮有限且功能明确,所以具有记忆方便、操作简单的优势。但是同时也具有重新设计成本高昂、无法完成复杂运动等局限。所以,这种人机交互方式比较适用于工业机器人进行大量重复作业的情形,但是不适用于工作环境多变、运动情况复杂的移动机器人。
以计算机为中心的人机交互系统
人机交互系统在计算机出现之后迎来了一个全新的阶段。使得人机交互系统的研究中心由机电系统转移到了计算机。人机交互的计算机时代经历了由指示灯和机械开关组成的操作界面、字符界面、图形用户界面三个大的阶段的。如今,论文网计算机人机界面已经相对良好和人性化了。可是,以鼠标、键盘、屏幕为代表的图形用户界面的发展上升空间已经不大。尤其是速度方面,基于生物特征(指纹、脸部特征、手势、声音)识别技术的交互,比使用鼠标、键盘、屏幕构成的人机交互系统更胜一筹。
人机交互系统的研究现状
多通道交互技术(Multi—Modal Interaction ,MMI),作为一种新兴的交互方式,近年来发展迅猛。MMI是指利用多种通道与计算机进行交互的技术。这里的通道覆盖面广泛,包括用户表达意图、执行动作和感知反馈的各式通信方式[3]。比如,语言、手势、表情等等均可以作为通道。2000年,西班牙牙Jaume大学机器人智能实验室研发出来基于语音识别人机交互方式的机器人Jaume—1[4]。同年,日本冈本大学的CAT型机器人也研发成功[11]。因为以自然语言作为指令语言,基于语音识别的人机交互系统具有快速方便、容易学习等优点。但是,语音识别同样具有识别精度低、识别代价高、识别耗时长,识别指令有限等局限。所以目前,语音识别技术作为移动机器人的人机交互方式的时机还不成熟。手势作为作为人与人之间一种直观的交流方式,也是理想的与计算机进行交互的通信通道。然而,由于视觉本身具有不适定性,手势本身具有多义性,基于视觉的手势识别技术还面临着巨大的挑战[12]。所以,目前还难以投入实用。