美国国家癌症研究所部署“癌症基因组信息云”试点项目

作者: 2015-01-05 14:26 来源:其他
放大 缩小

2014年9月24日,经过近1年半的酝酿和论证,美国国家癌症研究所(NCI)宣布实施“癌症基因组信息云试点项目”(Cancer Genomics Cloud Pilot)。获资助的机构包括美国哈佛-麻省理工Broad研究所、美国系统生物学研究所和SBG基因组学公司,三家分别获得了700万美元、650万美元和580万美元的试点资金[1],分别构建一个试点云。

“癌症基因组信息云”概念的提出,是为了促进生物数据计算分析模型的发展,该模型涉及建立一组数据存储库,这些数据库具有协同定位与存储的计算能力和应用程序界面(API),能够为分析工具的研发人员提供安全的数据访问权限。该模型中,应用程序是专门针对数据设计的,而不是将数据添加到应用程序中(数据适应程序)。这类“基因组学信息云”能够更好地获取NCI产生的基因组学数据,以更具成本效益的方式为癌症研究界提供计算支持。在当前阶段,开发这类技术的批量生产版本还为时过早,所以NCI计划资助三个“癌症基因组信息云”试点。试点开发完成之后,这些基因组信息云将向癌症研究界开放,进行测试和评估。

一、主要目标

该试点项目的主要目标是对癌症基因组学云服务进行设计、执行和评价。这些云服务将能够帮助获取关键的NCI数据集,以及协同存储的计算资源(包括存储能力、服务器和高容量网络)。试点所涉及的核心数据规模达2.5千兆字节(PB),并将进行协同管理。云试点将作为整个基因组学基础设施的一部分,包括即将实施的NCI基因组数据共享空间,这将有助于解决许多问题,如能够访问和分析从NCI资助的基因组研究中获得的大型、高价值的数据集。

二、实施过程与考核要求

云试点将分三个阶段:(1)设计阶段,为期3个月,确定云服务的最终设计;(2)执行阶段,为期12个月,完成每个设计的功能执行;(3)评价阶段,为期6个月,标准云服务将供NCI和癌症研究界使用,用来评估设计成本及其有效性。每个云试点的设计和执行将花费300-500万美元,云试点在评估阶段的费用则为50万美元。在运作过程中,选定的三个云试点将组成一个联盟,有助于确保云试点的互操作性。

将从技术架构、云数据管理和存储、计算服务、安全性、升级和可扩展性、互操作性、知识产权7个方面对三个云计算试点进行考核。

(王小理 阮梅花 熊燕)


[1] NCI Cancer Genomics Cloud Pilots. https://cbiit.nci.nih.gov/ncip/nci-cancer-genomics-cloud-pilots.

NCI Cancer Genomics Cloud Pilots Concept. https://cbiit.nci.nih.gov/docs/nci-cancer-genomics-cloud-pilots-concept.

附件: