国内外拟人形机器人头部研究现状概况_毕业论文

毕业论文移动版

毕业论文 > 研究现状 >

国内外拟人形机器人头部研究现状概况

国外拟人形机器人头部研究概况国外研究学者较早的开展了拟人机器人头部的研究工作。从现有的研究成果来看.尽管研究内容和技术手段不尽相同,但研究“的大部分集中在如何实现机器人与人白然交流的范畴内。只有当机器人能够与人类进行自然、流畅、友好的交流时,它才能真正担负迭护娱乐、家庭服务等职责,融人人类社会,成为人类的朋友。研究者们止努川吏机器人续有和人一样的眼睛、鼻、耳朵、嘴等器官,并能够通过这些器官的功能掌握外界信息.用和人一样的方式表达自己的情感意愿,如面部表情、语音等。下面详细介绍儿个有代表性的研究成果。6273
美闰麻省理工学院人工钾能实验室的计算机专家Cynthia breazeal开发了一个名为kiSmet的其有视觉和听觉功能的机器人头部,如图1所示kismet的眼部具有3个自由度来控制凝视方向,颈部具有3个自由度,面部表情具有15个自由度(包括眉毛、耳朵、眼脸、嘴唇和嘴等)。在两眼部装有视觉范围较窄的两部摄像机,用于目标的识别和精确视觉伺服控制,在两只眼睛之间固定有视觉范围较宽的两部摄像机,用于搜寻目标、跟踪多个目标。为了满足实视觉视觉信号处理的要求,把视觉系统连接到由9台运行QNX(实时操作系统)下的400 MHZ的商用计算机上。其动作和行为系统由4台摩托罗拉68332微处理器控制。语音识别部分运行在Windows NT和Linnx系统下。采用8个50 Hz 的DSP(TMS321 C40 )组成的并行网络进行图像处理.两个基于Motorala 68332的微控制器作为动力系统。Kismet设定了一个由激(Arousal、价(Valence )和态度(Stance)三个轴构成的二文情感空间。某一时刻的情感状态可以表示为情感空间中的一个点。这个空间被分成以某终特定点为中心的若干个区域,各个区域代表一种情感状态,某时刻的情感状态是根据Kismet的动机系统、行为系统以及感知系统的综合作用计算出来的,跟离该情感点最近的区域将被激活,Kismet根据被激活区域所代表的情感状态来驱动电机,从而带动面部特征运动产生相应的面部表情。而表情的幅度则由情感点与激活区域中心的距离所决定。它的外表虽然并不完全像人.但已能通过它的眼睛、耳朵以及大脑来识别人类的情感.井能够表达出相应高兴、汇丧、惊讶、疲倦、愤怒、安静、不高兴、害怕和感兴趣等9种表情了。日前 ,美国麻省理工学院正在研制的具有人类认知功能的机器人(Cog )。代表着机器人发展的最高水平。之所以命名为Cog,就是突出其认知能力,因为它具有眼、耳和四肢并其有模拟人脑功能的微处理器网络,通过与环境的相互作用,能够识别面孔、物体。以及跟踪运动物体等能力。cog由两个具有6个自山度的上肢、一个具有7个自由度的头部和一个具有3个关节的躯干组成,与Kismet相比,它具有更多的传感器。借助此机器人进行的主要研究内容有:研究感情模型、注意力、声音的韵律和模仿等(拟人行为),如图2所示。Cog的视觉系统模拟装置是双眼结构.眼睛能围绕着水平和竖直的轴转动。每只眼睛由两部摄像机组成,一部为广角摄像机,负责外围视野,另一个为窄角摄像机,用于景物中心的摄取。听觉系统由一对类似助听器的麦克风构成.立体声取样频率为22. 5 kHz,采用8位数据实现,cog的听觉系统具有良好的兽棒性。非常接近人的听觉系统,并且与视觉系统、驱动马达等部分进行了充分的整合。声音定位功能己经完成,当前的研究主要集中在多声音通道的隔离上。其前庭也是模仿人的前庭结构,由3个相互垂直安装的半圆形沟槽组成。另外,在眼睛的下方还安装了3个等级的陀螺仪和两个直线加速计。
日本早稻田大学1995年开发了头部机器人W E-2。经过不断的改进(WE-3 ,WE-3 R i V , WERV , WE-4及WE4R等),到2004年的改进型号为WE4R2 。 WE-3可以识别目标的位置、跟踪口标、适应亮度的变化、确定声音在三文空间中的位置、并通过触觉传感器分辨出抚摸、打击和碰撞等接触动作。增加了嗅觉传感器和彩色面部表情后变成一个新的型号WE-3RIV ,通过机械肺呼吸空气,可以识别酒精、氨气和香烟气。它具有了嗅觉功能和可变颇色的面部表情。 (责任编辑:qin)