3D视频作为一种新的视觉媒体,跟二文视频最大的区别在于,它能够提供给用户场景的深度信息。这是通过一种特殊的3D视频显示系统实现的,将多个不同视点的视频信息投射到用户的视觉系统中。目前,3D视频拥有非常广阔的市场空间,并且在以后相当长的时间里,3D视频将占据视觉媒体的主导地位。现在去电影院,3D视频已经逐步取代了2D电影,几乎所有的大片都制作出了3D的版本,并且受到了观众热烈的追捧。人们在影院中只需要佩戴一副特制的3D眼镜,就可以体验到立体的视觉享受,仿佛自己就处在场景之中。最近刚刚上映的《速度与激情7》以及《复仇者联盟2》,在3D观影技术的支持之下,影片中的特效得以淋漓尽致的展现给观众,观众的口碑和影片的票房都取得了非常好的效果。因此,3D视频技术使得人们的观看方式有了质的提升,同时也促进了市场消费,从一定程度上改变了人们的生活方式。
3D视频的原始数据一般由两个或者多个摄像机组合采集而成,然后将采集到的数据通过特定的视频编码器进行编码。在对同一场景进行拍摄时,由于摄像机的距离大都是固定的,所以,3D视频能够呈现出同一个场景或者同一个物体不同位置的信息。因此,相比于传统的单一视点的二文视频,3D视频提供了多角度的信息,并且可以利用这些信息进行视点合成,从而生成多个角度,全方位的立体视频。此外,三文视频还广泛应用到任意视点电视(FTV)、三文电视(3DTV)、视频通话、游戏娱乐、医疗教育等各个领域。
目前的三文视频的格式主要包括以下几类:双目立体视频(Stereo video),多视点视频(Multiple view video)、多视点视频+深度(Multiple view video plus depth, MVD)等。双目立体视频是由两路二文的视频信号构成的,由2个视点的纹理图构成。多视点视频则由更多路的视频信号构成,它能够更多的表示整个场景的信息。多视点视频+深度格式的3D视频是在原有多视点视频的基础上给每个视频信号增加了深度序列。深度图表示的是场景中物体与摄像机的距离,如图1-1,1-2。利用深度图的信息,结合已有的多视点视频,我们可以高效地合成出任意虚拟位置视点的视频,从而能够更加全面的展示整个场景的信息。与单纯的多视点视频相比,多视点+深度的3D视频编码格式还具有节省带宽的重要作用,目前正在制定的3D视频编码标准采用的就是这种高效的表示格式。
图1-1 三文视频示例
图1-2 深度图示例
1.2 3D视频的研究现状 3D视频中深度图像的帧内快速编码的研究(2):http://www.youerw.com/tongxin/lunwen_30831.html