文档介绍:华南理工大学
硕士学位论文
带深度信息Sprite的生成与MPEG-4编码方法的研究
姓名:江雪莲
申请学位级别:硕士
专业:信号与信息处理
指导教师:孙季丰
20040501
摘要·悠当嗦氡曜际墙谘芯康囊桓鋈鹊恪K且恢质悠的谌菘山换サ新的编码标准,提供了一些如形状编码、运动估计和补偿、纹理编码、编码及可分级编码等工具,应用于数字电视、流媒体、移动多媒体等领域。开发的是极低比特率的图像编码技术。编码后数据速率可以低于,将重点放在图像具体目标的交互性和可操作性上。蚐荕中的两个重要概念,是实现极低比特率传输的重要方法。是由视频对象所有可能出现在场景中的区域组成,这些区域在整个视频段中都可能出现,但并不全部象素都出现在每一帧。本文就生成中两个重要步骤,运动估计和参数几何模型的建模进行了详细的论述。生成的方法是,用搜索范围自适应的运动估计得到运动块的对应关系,再用梯度下降法计算透视模型的八个参数,得到物体运动参数。论文详细描述了用透视模型的全局运动估计生成的算法,同时,就二维的编码特点,讨论了论文下一步工作是提取图像的前景对象和背景的三维信息。在摄像机参数和拍摄参数都已知的情况下,根据图像特征点之间的视差关系来获取三维信息。论文中详细描述了其理论原理。图像序列特征点的选择和匹配,是在边缘点中选择相关系数符合条件的点,利用三个图像之间的极线关系直接进行匹配。论本文所进行的研究希望可以在两个方面带来促进作用:第一,传输统的编码是只针对二维视频的,本研究希望会带来更广阔的应用前景:第二,在二维视频序列中较为快速提取真实的三维信息,并使用技术试图实;一惶卣鞯悖皇硬摘要本文研究带深度信息的生成,并对编码方法进行初步研究。的部分编码方法。文给出详细的步骤和实验结果。最后对三维的编码特性进行了初步探讨。视频流的时候,可以同时得到摄像机的运动信息,对视频流进行三维重构,而传现最低码率下传输三维信息,可以减少三维信息的数据量,对网络上传输三维信息大有好处。关键词
兰皇堡三奎兰婴主主堡笙苎甇,,,一琭瞖.,,,.猺.,甌瓵口......瑆甌。,一琒,
导师签名:分乃垂专日期:≯。中年耮日学位论文版权使用授权书华南理工大学学位论文原创性声明日期:D月吕日作者签名:移磅亳作者签名:前保密口,在——年解密后适用本授权书。日期:知薛年‘月沪。曰同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完本学位论文作者完全了解学校有关保留、使用学位论文的规定,允许论文被查阅和借阅。本人授权华南理工大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫不保密回。全意识到本声明的法律后果由本人承担。描等复制手段保存和汇编本学位论文。本学位论文属于朐谝陨舷嘤Ψ娇蚰诖颉啊獭
第一章绪论引言如何在最大逼真度的前提下减少信息的传输量、存储量,是近年来国际上多媒体专家重点研究的课题。以往,通过海量的数据,我们可以欣赏逼真的电影、可以让科学家模拟试验、操作那些现实世界中代价昂贵、实旋困难、非常危险或三维信息的可视化重点放在如何真实、快速地显示三维数据场,近期学术界的趋势是更强调多领域的交叉研究,以适应多元化的实际应用。如现在三维信息的及时融入新的技术。由于将内容和交互性作为的核心,就不再把具体的输上与具有一定的相似性,但是它也支持高质量的视频语音通信。所以,是提出的一个重要的编码方法。在许多应用场合中,背景自身是没有任何局部运动的,其每帧所产生的变化是由于前景物体的运动,一部旋转、缩放所产生的比较复杂的变化。为了有效编码这类图像,可以将某一背景在一段时间的内容拼接成一幅完整的背景图像,这种台成的图像即是。在传输过程中,可以只根据最初的几帧图像,合成相对完整的图像,把图像一次传输给接收方;在以后的视频传输中,只传输更新的信息,和前景与图像的相对位鹭、运动信息。这样,可以节省很多的带宽,大大降低的生成关键是要定位新来的一帧背景中的象素是否有在已有的图像中出现,如果有,则要定位出对应于的哪个位置;如果没有,电视,甚至可以通过数据的可视化把抽象变形象,可以更大程度上提供娱乐,更者是现实世界中不可能进行的事情。可视化,和多媒体技术的结合,是研究人员在探讨多媒体技术如何进一步发展,满足将来人们需要的一个方向。交互式多媒体、流媒体的应用,提供一些如宽带网三维虚拟世界的视频会议、网上购物、动画游戏等,是电信运营商们渴望用来发展网络新业务的技术,也将会给多媒体、通信应用的发展起到了革命性的推动作用。满足了