3D视频中深度图像的帧内快速编码的研究(2)

3D视频作为一种新的视觉媒体，跟二文视频最大的区别在于，它能够提供给用户场景的深度信息。这是通过一种特殊的3D视频显示系统实现的，将多个不同视点的视频信息投射到用户的视觉系统中。目前，3D视频拥有非常广阔的市场空间，并且在以后相当长的时间里，3D视频将占据视觉媒体的主导地位。现在去电影院，3D视频已经逐步取代了2D电影，几乎所有的大片都制作出了3D的版本，并且受到了观众热烈的追捧。人们在影院中只需要佩戴一副特制的3D眼镜，就可以体验到立体的视觉享受，仿佛自己就处在场景之中。最近刚刚上映的《速度与激情7》以及《复仇者联盟2》，在3D观影技术的支持之下，影片中的特效得以淋漓尽致的展现给观众，观众的口碑和影片的票房都取得了非常好的效果。因此，3D视频技术使得人们的观看方式有了质的提升，同时也促进了市场消费，从一定程度上改变了人们的生活方式。
3D视频的原始数据一般由两个或者多个摄像机组合采集而成，然后将采集到的数据通过特定的视频编码器进行编码。在对同一场景进行拍摄时，由于摄像机的距离大都是固定的，所以，3D视频能够呈现出同一个场景或者同一个物体不同位置的信息。因此，相比于传统的单一视点的二文视频，3D视频提供了多角度的信息，并且可以利用这些信息进行视点合成，从而生成多个角度，全方位的立体视频。此外，三文视频还广泛应用到任意视点电视（FTV）、三文电视（3DTV）、视频通话、游戏娱乐、医疗教育等各个领域。
目前的三文视频的格式主要包括以下几类:双目立体视频(Stereo video),多视点视频(Multiple view video)、多视点视频+深度(Multiple view video plus depth, MVD)等。双目立体视频是由两路二文的视频信号构成的，由2个视点的纹理图构成。多视点视频则由更多路的视频信号构成，它能够更多的表示整个场景的信息。多视点视频+深度格式的3D视频是在原有多视点视频的基础上给每个视频信号增加了深度序列。深度图表示的是场景中物体与摄像机的距离，如图1-1,1-2。利用深度图的信息，结合已有的多视点视频，我们可以高效地合成出任意虚拟位置视点的视频，从而能够更加全面的展示整个场景的信息。与单纯的多视点视频相比，多视点+深度的3D视频编码格式还具有节省带宽的重要作用，目前正在制定的3D视频编码标准采用的就是这种高效的表示格式。

图1-1 三文视频示例
图1-2 深度图示例
1.2 3D视频的研究现状 3D视频中深度图像的帧内快速编码的研究(2):http://www.youerw.com/tongxin/lunwen_30831.html