文档介绍:案例分析
StorNext 与 Scalar 系列
针对 DNA 有关的工作,StorNext 数据管理为基
“StorNext 在一款解决方案中集高速
因组测序中心提供强大支持数据共享和经济高效的内容保留功能
于一身,让我们的研究人员可以根据
在数据处理上,很少有工作能比 30 亿物质单元(它们构成了人体 24 种不同的染色体)的测序工作更需要快捷地访问数据,并显著降低了
繁琐。美国贝勒医学院人体基因组测序中心(HGSC) 在数据的共享、管理和存储方面曾面临巨大难题, 原有系统固有的高管理负荷。”
但自从部署了昆腾 StorNext 数据管理软件后,一切问题迎刃而解。
Geraint Morgan
信息系统主管
传统的技术架构阻碍了研究的进展 Morgan 表示:“庞大的数据量让网络基础设施倍受压力,
美国有三大联邦政府赞助的基因组测序中心,它们致力而且也限制了数据的访问能力,这点对于我们这种研究机
于研究基因对人类疾病的影响,并不断积累这方面的知构来说至关重要。同时,我们需要保证研究人员测序链条
识。作为三大中心之一,HGSC 拥有不到 200 名工作操作的末尾不受影响,这样一来如此庞大的数据量也大大
人员,包括约 40 名专门分析 DNA 定序数据的研究专加重了管理的负荷。”
家。中心每天会生成大量数据,同时还需要保证数百 TB
为了扩展 HGSC 的存储能力,他们又构建了一个数据中
的数据可以随时访问以供分析之用,这种情况下,
心。但是 Morgan 仍面临着一个难题,就是如何实现对包解决方案概述
HGSC 陈旧的技术架构已成为开展重要卫生研究工作
含服务器、网络和存储技术在内的复杂异构环境实现集中
的绊脚石。
的管理。对于这类政府赞助机构来说,购买新技术面临资 StorNext 文件系统
2008 年 8 月,Geraint Morgan 作为信息系统主管加金限制,所以他需要对现有的服务器和存储阵列进行扩容, StorNext Storage Manager
盟该中心,当时的技术已无法满足日益加快的定序数据而不是彻底“改头换面”去采用全新的方法。 Scalar i2000 磁带库系统
生成和分析要求。
Morgan 表示“我们需要的解决方案不但要能发挥现有硬
HGSC 拥有 32 台基因组测序设备,包括 20 台件的作用,还要具备轻松的扩展能力以满足今后两年预计主要优势
Applied Biosystems SOLiD 测序机、2 台 20 PB 测序数据的需要。这套解决方案必须能够在环境发
Illumina Genome Analyzer 和 10 台生改变时确保整体管理不受较大影响。”支持同时访问大批量数据而不会影响系统
Roche/454Genome Sequencer。而其中效率最高用户
的设备每天大约可以生成最多 1 TB 的原始数据。通过自动化数据管理提供经济高效的内容
STORNEXT 在高性能和满足数 PB 环境要求方创建
Morgan 面临着这样一种环境:DNA 测序产生的主要面的良好声誉是巨大“卖点”
支持异构环境的集中管理
数据最初要从本地写入所连接的存储设备(这些设备分 Morgan 最初把目标锁定在多家厂商身上,并通