1.3.2 本文的章节安排
本文由绪论、本论和结论三部分组成。本论共三章。第二章会对Kinect设备构成,技术特性,功能作相应介绍。第三章介绍姿态数据库所需要用到的kd树算法以及姿态数据库的建立。第四章是实验内容,包括运行测试和结果分析。结论分析说明对系统测试的评估结果。
2 Kinect基本工作原理
2.1 引言
Kinect,是由微软开发,应用于 Xbox 360 主机的周边设备。“Kinect”为 kinetics(动力学)加上 connect(连接)两字所自创的新词汇。它让用户不需要手持或踩踏控制器,而是使用语音指令或手势来操作 Xbox 360 的系统界面。它也能捕捉玩家全身上下的动作,用身体来进行游戏,带给玩家“免控制器的游戏与娱乐体验”。2012年2月1日,正式发布面向Windows系统的Kinect版本“Kinect for Windows”。
2.2 Kinect的基本构造与功能
2.2.1 Kinect组件构成
Kinect体感控制器是一个外型类似网络摄影机的装置。有三个镜头,中间的镜头是 RGB 彩色摄影机,左右两边镜头则分别为红外线发射器和红外线 CMOS 摄影机所构成的3D深度感应器。Kinect还搭配了追焦技术,底座马达会随着对焦物体移动跟着转动。Kinect也内建阵列式麦克风,由多组麦克风同时收音,对比后消除杂音。我们着重介绍Kinect光学组件。Kinect的RGB摄像头用于捕获彩色图像。CMOS摄像头用于捕获红外图像。红外线发射器可以覆盖整个Kinect的可视范围。CMOS摄像头则接收这些反射光线来识别镜头前的参与者。不受周围环境的光照条件影响。
图1 微软Kinect体感外设
附Kinect技术规格:
1)传感器:
色彩与景深镜头;
语音麦克风阵列;
机动底座用以自动调整Kinect本体角度;
2)视角:
水平视角:57度
垂直视角:43度
物理倾斜范围:±27度
景深镜头感应距离:1.2米至3.5米
3)数据:
分辨率320x240;16位色深;30fps
分辨率640x480;32位色深;30fps
16位16kHz的音频采集
4)骨骼跟踪系统:
最多识别6人;可同时动作捕捉2人
每个动作捕捉对象上有20个捕捉点
可以将动作1比1对应到XBOX Live虚拟人偶身上。
5)音频系统:
支持XBOX Live语音聊天和游戏中语音聊天
回声消除系统提高音频质量
多语种声音识别支持
2.2.2 Kinect基本原理
1.侦测3D图像:
不同于普通的通过计算得到物体3D坐标的设备,Kinect可以直接获取物体与摄像头之间的距离,这是Kinect最受人瞩目的一个功能。微软先后于2009年和2010年收购了3DV Systems(TOF)和PrimeSense(Light Coding)这两家以色列公司,并最终采用了Light Coding技术作为Kinect体感设备的深度摄像功能的基础。 Light Coding技术理论是利用连续光(近红外线)对测量空间进行编码,经感应器读取编码的光线,交由晶片运算进行解码后,产生一张具有深度的图像。Light Coding技术说到底还是结构光技术。但与传统的结构光方法不同的是,他的光源打出去的并不是一副周期性变化的二文的图像编码,而是一个具有三文纵深的“体编码”。这种光源叫做激光散斑(laser speckle),是当激光照射到粗糙物体或穿透毛玻璃后形成的随机衍射斑点。这些散斑具有高度的随机性,而且会随着距离的不同变换图案,空间中任何两处的散斑都会是不同的图案,等于是将整个空间加上了标记,所以任何物体进入该空间以及移动时,都可确切记录物体的位置。 基于微软Kinect体感游戏控制器的人体姿态识别方法研究(5):http://www.youerw.com/jisuanji/lunwen_3676.html