1 / 6
文档名称:

大数据量的业务系统分析与解决方案.pdf

格式:pdf   页数:6
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

大数据量的业务系统分析与解决方案.pdf

上传人:所以所以 2012/5/28 文件大小:0 KB

下载得到文件列表

大数据量的业务系统分析与解决方案.pdf

文档介绍

文档介绍:现实世界商务竞争越演越烈,出现更多的细分市场、深度营销和定制功能,
这导致各种商务应用的用户数和业务复杂度同步增加。反映到数据库里,就是表
的数量和数据量日益增长,数据库响应速度日益缓慢。
为什么一个功能好的产品,往往上线后就出现性能问题,不得不反复回炉修
改?为什么一到业务高峰期,系统就慢的动弹不得,只能关闭部分业务保障关键
业务?数据量从十万到百万,从百万到千万,从千万到上亿,从亿再向兆跨越,
如何保障程序能够经受住大数据量的考验?这都是我们面临的真实现状,也是大
家反复在思考的问题。
《道德经》上说:“有道无术,术尚可求,有术无道,止于术。”众人把目光集中
在系统架构、查询算法、数据库软件的底层原理等等“术”上,却忽视了深刻理解
数据这条光明大“道”。数据从哪里来?要到哪里去?数据用来读还是写?数据与
数据之间有什么样的关系?数据的增长速度如何控制?最有价值的数据是什么?
数据什么时候可以丢弃?假如不能回答这一长串问题,如果不是以这一长串问题
的答案为程序设计的出发点,代码如何能经受大数据量的考验?
在数据的采集、计算、展现和存储这一设计链条中,开发者通常负责设计关
系型数据模型,编写程序计算和展现数据,数据库管理员负责数据文件存放位置、
表空间存储参数等的架构设计。但是,数据库管理员往往不了解业务,不了解数
据的特点,数据存储设计表现为千“表”一律。
数据存储设计模式是根据数据的真正特点,仔细分析数据流向、数据访问特
点、数据量、数据增长量和数据生命周期,对数据进行分类,然后根据不同类型
的数据设计不同的存储策略。正确的应用数据存储设计模式,可以几倍,甚至几
十倍的提高数据访问效率。
大数据量下的数据特点
全球最大数据库的数据量已经先后越过了 MB 量级、GB 量级和 TB 量级,
站到了 PB 量级的门口。在庞大的数据量面前,对数据进行分类显得尤为重要。
人们对数据感兴趣的时间是不一样的,大量的数据进入数据库后,经过计算、聚
集和转换,仅有少量的活跃数据需要长期保留在数据库中,剩下的数据只有备查
的价值,可以暂时存储在数据库中或者离线备份,等到休眠数据完全没有价值后
直接删除。
需要长期保留在数据库的活跃数据可以称之为核心数据,它是整个商业活动
中最有价值的数据,需要长期甚至永久的保留。程序完成处理后只需要备查的休
眠数据可以称之为过程数据,是伴随核心数据流动所产生的数据,它的存在周期
视商业活动的重要性而定。
数据的分类有利于把资源聚焦于有价值的数据,我们可以通过以下几个方面
识别核心数据和过程数据:
识别项核心数据过程数据
数据流向几乎不流动按工作流的方式运动
数据的访问特点主要读,多半是关联查询主要写,更新和删除涉及到查

数据量大非常大
数据的增长量增长缓慢或者完全不增长增长迅速,甚至是爆发性的
数据生命周期长,甚至永久的保留短,几天到几个月不等

在大数据量环境下,数据库服务器的资源是昂贵的,混合核心数据和过程数据的
后果就是资源被不重要的数据占用,被不必要的进程占用,导致性能缓慢和堵塞。
常见的误解数据特点的现象包括:
核心数据和过程数据以不同字段的形式在同一条记录里存放
核心数据和过程数据以不同记录的形式在