文档介绍:SQL Server 数据库高可用性及性能提升研究
1 1 绪论
研究背景
随着 SQL Server 2005 的推出,标志着微软开始大力拓展数据库市场。相比 SQL
Server 2000,SQL Server 2005 几乎是一个全新的产品,因为微软花了将近 5 年时间,
重写了 SQL Server的大部分代码,数据库的执行效率有了质的飞跃,加入了管理视图,
使得数据库的管理和性能调优更为方便。最值得一提的是加入了“数据库镜像”功能。
增加了数据库的高可用性。而且,“镜像”可以与“群集”、“日志传送”混合使用,满
足企业的各种高可用性需求。SQL Server 从2005 版后迅速地缩小了和 Oracle 的差距,
它已经不是传统印象中的小企业使用的数据库。而是堪当重任了。
国内外现状
纳斯达克股市
NASDAQ 是美国最大的电子股票市场,因为它相当于中小板市场,所以有多达 3300
家公司的股票在其上交易,也因此要比美国其他的股票市场提供更多的交易支持、和数
据共享。
说起纳斯达克采用的数据库系统,一般人脑海里马上会飘过 Oracle,或 DB2,但事
实上支持这个名闻遐迩的股票市场的数据库系统竟然是不起眼的 SQL Server。
借助于微软 SQL Server 2005,纳斯达克在十周内成功地上线了新的实时在线交易
系统。这套系统实际应用中每秒可处理多达 32,000 笔数据库调用,而测试峰值更达到
了每秒 60,000 笔数据库调用。
可见 SQL Server 只要配置合理,完全可以应付世界上最大的交易量。
USDA 美国农业部数据仓库
美国农业部需要保存美国土地使用和地形学详细数据。这些数字图象和信息需要
37TB 的磁盘存储空间,目前容量 ,见表 1-1,为使其数据有一集中和更为可靠的
1
SQL Server 数据库高可用性及性能提升研究
来源,美国农业部决定建造一个地理空间数据仓库。并最终选择使用微软 SQL Server
存储其所有数据。该解决方案加强了数据性能,数据仓库的 Web 访问能力,和系统总体
功能,而此系统在近期可升级到 37TB 的计划容量。
表 1-1 美国农业部数据仓库
Table 1-1 USDA datawarehouse
关键的数据仓库指标
最大的数据库 的地理空间信息
最大的表 720GB
表中最大的行数 3000 万
和纳斯达克的案例相比,该数据库的特点是海量数据。从网上查到的数据显示,这
是世界上容纳数据最多的数据库之一。
国内的新兴电子商务公司
麦考林国际邮购有限公司是一家涉足电子商务领域的公司,在中国拥有 3000 多名
员工。并于 2000 年 4 月开通了电子商务门户网站——“麦网”。公司的年销售额达到
30 多亿。支持该公司的网站、呼叫中心、门店、邮购业务的核心数据库,都是微软的
SQL Server。并且规模都达到了 TB 级。值得一提的是,麦考林的主数据库以前是 Oracle
8i,后来才迁移到 SQL Server的。因为,他们发现综合考虑执行效率和拥有成本,SQL
Server 是最好的选择。另外,除了麦考林之外,凡客成品、当当等著名的电子商务公
司,也都是采用 SQL Server 作为主数据库。
由此可见,SQL Server是完全可以胜任大并发量和大数据量的应用的。在国内外都
不乏成功案例。随着 SQL Server 2005 的推出,SQL Server 的执行效率甚至也赶上了
Oracle。考虑到 SQL Server的易用性和较低的总体拥有成本。未来 SQL Server在数据
库市场的成长是相当乐观的。
本论文的主要工作
根据网上的一项调查,我国企业中选用 SQL Server 作为企业核心数据库的比例超
过 70%[1],然而另一方面 SQL Server 却一直在人们心目中是一种简单的数据库,谈到
2
SQL Server 数据库高可用性及性能提升研究
企业级数据库,人们言必称 Oracle、DB2。很多企业级应用方面的文章都是基于 Oracle
的。当前的现状是 SQL Server 用得很多,但基于它的企业级应用方案却研究得很少。
因此,很有必要在这方面做一些工作:
SQL Server 高可用性方面:
通过某公司的主数据库升级项目,在微软官方的高可用方案的基础上,提出了一个
精简方案,该方案的优点是减少了设备投入,并可以防止见证服务器失败情况下产生“脑
裂”的风险。