文档介绍:随着大数据在医疗与生命科学研究过程中的广泛应用和不断扩展,其数量之
大和种类之多令人难以置信。比如:一个 CT 图像含有大约 150MB 的数据,而
一个基因组序列文件大小约为 随着大数据在医疗与生命科学研究过程中的广泛应用和不断扩展,其数量之
大和种类之多令人难以置信。比如:一个 CT 图像含有大约 150MB 的数据,而
一个基因组序列文件大小约为 750MB, 一个标准的病理图则大得多,接近 5
GB。如果将这些数据量乘以人口数量和平均寿命,仅一个社区医院或一个中等
规模制药企业就可以生成和累积达数个 TB 甚至数个 PB 级的结构化和非结构化
数据。
在中国,2010 年,国家公布的“十二五”规划中指出要重点建设台,建设电子档案和电子病历两个基础数据库等诸项目
标,也就是推进医疗信息化的“3521”工程。过去由于缺少统一的电子病历系统
(EMR)标准,中国的电子病历系统发展比较缓慢, 医院之间不能实现共享病患信
息共享,医疗服务水平也因此受到影响。为改善这一现状,国家会逐渐加大对电
子病历的投入,适应这一趋势,各级医院也将加大在数据中心,IT 外包等领域
的投入。而随着医疗信息数据的几何倍数增长,医院信息存储将越来越受到重视,
医疗信息中心的关注点也将由传统“计算”领域转移到“存储”领域上来。
有“弊”就有“利”
对于许多医疗和生命科学机构而言,努力控制大数据造成的呈螺旋上涨的成本、
复杂性和风险已经成为一个至关重要的问题。然而,从另一个角度来看,医疗大
数据能够带来的收益要远远超出管理它们的成本,如开放新的具有医疗价值的信
息源、提高诊断准确性和速度、预测疾病和健康形态,以及取得生命科学创新的
不同见解。美国管理咨询公司麦肯锡全球研究院(MGI)预测,如果美国的医疗
行业能够有效利用不断增长的大数据来提高效率和质量,那么每年可创造超过成,可基于 HDS 平台、客户解决方案或合作伙伴的应用平台使用。这些解决方
案所具有的独特功能包括:
集成存储 – 文件、内容和块服务在单一管理界面中融合。通过跨平台创建存储
池和利用虚拟化,客户可以简化管理,提高利用水平,并恢复或延长现有资产的
使用寿命。
智能分层 – 动态分层存储架构通过预定义存储层、数据索引和制定自动将数据
迁移到对应层的策略管理基于文件的数据(如 pdf 文件或医学影像)。通过自动
将活跃数据迁移到适当的平台,你可以优化磁盘要求【例如:在低成本的 SATA
硬盘里存储更数据,多 同时减少在费用高昂的光纤通道、SAS 或固态硬盘(SSD)
上存储数据】。这一策略根据精确的业务运行