第四章:平面单应算法在2D转3D中的应用。本章详细介绍了平面单应法在2D转3D中的应用,并结合仿真结果分析了此方法的优缺点。
第五章:2D转3D总结与展望。对论文进行了综合性的总结,以及提出了对下一步工作的展望,及未来2D转3D的发展趋势。
第二章 2D转3D基本原理
2.1 双眼立体视觉原理
人用肉眼观察景物时,根据近大远小、光线明暗、景物遮挡等因素产生空间感。人的左右眼看同样景物,因两眼所见角度不同,在视网膜上形成的像也不完全相同,这种左右观察的差异就是通常所说的双目视差。左右眼图像经过大脑复现成3D心理图像后,就能区分物体的上下、左右、前后和远近,从而产生立体视觉。3D电影的拍摄、制作和放映的过程就是模拟人眼观察景物的过程,它在拍摄时用2台摄像机,按人眼双瞳孔之间的距离(约64mm)拍摄同一景物,从而得到不同角度的图像对(左、右眼图像)。在利用3D技术制作3D动画时,也是模拟人眼的瞳距和角度,分别生成左眼图像和右眼图像,形成具有视差的图像对。放映时,将这一图像对同时放映到银幕上,这时银幕上会出现重叠交错的2个影像。观众在看3D电影时,只要戴上“立体眼镜”,就可以让左眼看到左图像,右眼看到右图像,再通过大脑复现成3D心理图像,感受到似乎是触手可及的立体感觉。单个空间点的3D信息获取可用图1来说明。
图1所示为一个简单的立体视觉系统,2台相同的摄像机按光轴互相平行、X轴互相重合且相聚为B的位置放置;其光轴平行于Z轴,图像平面I1和I2与(x,y)平面平行。图中O1,O2分别为左右2台摄像机的焦点,Pl和Pr分别是空间点P在左右像平面上的成像点,f为焦距,则定义视差为D=Pl-Pr,感受到的立体深度为:
可知,立体深度与视差成反比,视差越大说明物体离摄像机越近;反之,距离越远。
2.2 2D转3D技术的分类
2D转3D技术的核心任务是从普通的2D视频中获取每一帧所对应的深度息。 3D渲染原理基本可以分为2大类:第一类是采用了双目立体技术的渲染(binocular stereoscopic rendering,BSR),它十分类似于传统的3D电影的渲染方式,通过采用某种方法从单一的视频帧中直接重建出具有视差的
左右眼图像对;另一类是基于深度图的渲染(depth imaged-based rendering,DIBR),其转换结果是在原视频的基础上附加了每一帧所对应的度图,最后由嵌入DIBR处理模块的显示终端将其输出,并将其转换为双目立体视频后供观众进行观赏。
目前在3D电影中前者居于主流,后者则以其独到的 3个特点:高效的压缩传输效率、与现有2D技术和不同设备的兼容性以及在实时立体视频生成上的技术优势,在新兴起的 3DTV,3D移动终端等市场占有绝对的主导地位,是 3D渲染技术未来发展的方向。然而,从本质上看,2类技术的效果是相的,其结果都是由传统的 2D视频生成了具有视差的立体视频对,只是DIBR技术中的深度信息由深度图来保存,最后一步的转换由设计的硬件电路来完成 .这2类技术是可以相互转换的,BSR可以由立体图像对的视差根据立体视觉原理得到深度图,而DIBR到BSR也可以进行转换.。
2.2.1 基于深度图的渲染
单路的 2D 视频要生成具有立体效果的3D视频,主要须经过2D视频的获取、深度视频的生成、另一路视频的生成、3D 视频的生成和 3D 视频的显示等重要步骤,当然每一个模块下可以采用不同的算法来实现 平面单应法在2D/3D中的应用(3):http://www.youerw.com/tongxin/lunwen_71617.html