1 / 5
文档名称:

破解多媒体大数据分析难点.doc

格式:doc   大小:105KB   页数:5页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

破解多媒体大数据分析难点.doc

上传人:jiaxidong_01 2017/2/19 文件大小:105 KB

下载得到文件列表

破解多媒体大数据分析难点.doc

文档介绍

文档介绍:1 破解多媒体大数据分析难点智慧城市建设中,尽管我们布设了很多摄像头,但在多媒体数据处理方面还存在一些问题和挑战, 需要理论、系统、技术等多领域专家共同协同,才能真正实现城市“智慧”。智慧城市建设涉及多个领域、不同层面的数据资源获取、处理和分析。这些数据应用于医疗卫生,能够实现精准医疗;数据应用于教育行业,可以实施个性化教学; 而城市监控数据为城市管理者所用, 能够提升管理效率、改善民生服务。目前,以北京为例,覆盖全城、多点布局的摄像头数量达 2000 万之多, 而这些摄像头捕捉到的数据信息往往是在“睡大觉”。一般 1~2 个星期、最多 1~2 个月为一个周期, 过往信息就会被覆盖掉。如何从这些信息中抓取有用数据、扔掉无用数据, 是我们当前面临的难题。这类音视频多媒体数据要真正实现有效应用, 面临三大挑战,即“存不下”、“看不清”、“找不到”。优化编码技术研究这三大挑战背后对应的技术问题是指我们的编码算法技术还有提升的潜力和空间。一方面, 随着摄像头数量不断增加, 获取的信息量不断增长, 可能导致“存不下”这一问题; 另一方面, 计算机识别图像与我们人眼看东西不同, 需要较高的清晰度。目前, 我们城市摄像头的数量基本已达到 5米或 2 10 米一个,但人脸识别率还是较低,就存在“看不清”的问题。此外,摄像头物理参数的不同也会导致出现这一现象: 我们肉眼看某人从 A 点走到 B 点, A 点摄像头捕捉到这个人,但到了 B 点可能就“找不到”了,这就存在跨摄像头搜索的问题。针对这三个问题,我们需要三种不同的技术来应对它。针对“存不下”问题, 我们需要从更新编码技术这个思路去寻找破解之道。高效视频编码是应对这一问题的直接技术手段。因为数字视频其实是一个数字图像序列, 数字图像表现的是数字信号, 而数字信号我们可以对其进行处理。经过分析,我们发现数字图像序列中有三类信息冗余,一是时间冗余, 二是空间冗余, 三是感知冗余, 当然也有知识冗余等其他冗余。如果我们能够把这些冗余挤掉,就能更有效地压缩数字视频。针对不同类别的冗余, 我们必须采用不同的方法。理论上, 我们通过矩阵运算或通过矩阵分析可以找到视频编码的上界即最大压缩程度。例如,针对 2000 × 2000 像素这样尺寸的图像,理论上我们能压缩 2000 倍, 即压缩到 2000 :1, 但实际上我们能做到的是 600 :1, 中间还有很大空间, 需要采用各种不同技术来突破。编码技术变革 1993 年第一代编码技术通过优化能把高清视频压缩到了 1/75 , 200 3 年第二代编码技术把编码性能提高了一倍, 2013 年有了第三代编码技术, 压缩能力又提升了一倍。以此类推, 2023 年将产生第四代编码技术, 其压缩能力将达到 1/600 。我们把这种规律视为编码领域的摩尔定律,十年性能翻一番。 3 其实, 从第一代到第三代编码技术, 都是遵循最基本的编码框架结构, 即从视频信号进来, 切成块变换处理, 再进行滤波运能估计。但基于这一架构,编码性能却能十年翻一番。如何实现?主要是采用多种数学工具, 如预测编码、算术编码等, 或者多种工具混合利用使得编码效率不断提升。通过观察分析, 我们看到, 在三代编码技术不断演变过程中, 真正的变化是在预测与运动估计这一项上, 每一代都不一样。这也会给我们提供启发, 为寻