西虹网

您所在的位置: 西虹网 > 科技 > 生命奥秘 >

高机能计较助力揭开生命机密

http://www.xihong021.cn/   2014-01-29 22:38   网络转载    【字号:  

  当“天河二号”以每秒33.86千万亿次浮点运算速度再次荣登全球超等计较机500强排行榜榜首的时候,我一直有两个疑问:一是33.86千万亿次计较本领是不是通过增加处事器数量就可以实现,有没有这么简朴?第二什么应用需要如此强大并行计较本领,所谓计较本领是不是一个数字游戏。

  基因研究和超等计较机

  如今,这两个问题都有了谜底。首先要实现千万亿次浮点运算不是那么简朴的。以天河二号为例,参加LINPACK测试的节点有16000个,耗时5个多小时,在这个进程中,只要有一台处事器呈现妨碍,测试就会宣告失败。这意味着假如节点处事器的妨碍率是万分之一,1.6万台节点处事器就意味着测试100%不会乐成。因此,参加运算的呆板数量越大,失败的风险越高。别的,节点之间的网络延时、效率都是问题。总之,要构建一台千万亿次超等计较机照旧有许多技能难点要降服。

  有关第二个问题,我在华大基因也找到了谜底。

  说到基因,我是的简直确的外行人。但也知道环绕基因研究存在的庞大争论。有人说人类掀开基因这本本来只有上帝才气阅读的“天书”时,谁有权拥有能洞悉个别生命的基因信息?有人将其称为困扰人类社会的新斯芬克司之谜。但这也从别的一面说明白基因研究所带来的成绩。

华大基因高机能计较研发主管王丙强博士

  华大基因高机能计较研发主管王丙强博士

  在华大基因展厅,可以看到许多与基因研究相关的成就,从分子选育石斑鱼——青龙斑,到小米,我们看到这些石斑鱼不只体积硕大,听说肉质鲜美;小米则高产优质。这都是依托基因组学的生物分子育种成就。在生物医药、康健等规模,基因研究都有着光亮的前景。

分子选育石斑鱼

  分子选育石斑鱼

颠末基因改革过的3岁半生榕树

  3岁半榕树(右)和轻木(左)比拟,对轻木正在展开基因方面的相关研究

  有关基因争论不做评述。我体贴地是,基因研究和超等计较本领之间的干系。

  在华大基因,我采访了华大基因高机能计较研发主管王丙强博士和华大基因康健云运营总监官鑫先生。

  谈到基因对付超等计较的需求,王丙强暗示主要有三个维度,一个是数量的增加,从人类基因组打算,到千人基因组打算,数量的增加导致对计较劲的不绝需求。与此形成光鲜比较的是测序本钱的大幅度低落。

  “以前做1M的基因序列测序,2001年或许需要6000美元,此刻或许只要10个美分,降幅高出一万倍,这也为商用缔造了条件。” 王丙强说。

  针对同一小我私家,凭据差异时间段,汇集样本举办阐明,其计较劲长短常大的。因为仅基因数据已经是指数增长了,加上时间维度,其计较劲更是大幅度增长。

  别的一个与超等计较机计较本领相关的技能对基因未知因素的摸索。对此,王丙强暗示:如今容易做的都做了,有些基因成果是较量容易辨别出来的,以树种为例,有些树长得粗壮一点,有的长得快一点,很容易把相关基因找出来。但有些是较量巨大的,而有些是有关联,要这个搞清楚至少就需要更多的计较劲。“剩下的都是不容易做的工作。”王丙强说。

  据先容,我们人有或许1万亿个细胞,每个细胞有23对染色体,染色体包括DNA,由ATCG差异碱基序列组成,数量或许有30亿。生命暗码就包括在这些序列中。从研究希望看,已经把握的编码(基因)有数万个,且有更巨大的非编码区域期待摸索,这需要越发大量的计较。

  “有许多应用,用一台计较机算1~2年也可以算出来;但别的一些问题,就不能在有效时间内完成,譬喻某些阐明需要4~5年,这就是超出了这一代测序技能的有效期,就没有意义了。” 王丙强说。

  “在临床上,也需要更强大的计较本领,花几十个小时才气把数据阐明完,这在许多环境下各人接管不了,出格一些很是紧张环境下,要求迅速获得功效,这都需要强大计较本领作为保障。” 官鑫说。

  英特尔MIC和序列比对软件BWA

  晋升高机能计较本领,CPU+GPU方案被广为看好。在天河二号中,也操作了英特尔集成众核(MIC)架构,Xeon Phi MIC处理惩罚器让天河二号如虎添翼。

  “我们也思量回收MIC方案。” 王丙强说。

  据先容,序列比对软件BWA是基因研究常用的软件,仅仅获取基因还不足,还需要举办序列比对,才知道跟别人有什么纷歧样,从中发明问题。可是序列比对代码分支许多,并且有许多随机的会见。这并倒霉于Xeon Phi MIC处理惩罚器机能的发挥。

序列比对软件BWA

序列比对软件BWA

  “一开始我们是有一些记挂的,BWA应用对内存会见随机,代码分支多,这样的应用在一般多线程下执行都有一些问题,Xeon Phi MIC有200多个线程,这不得不让人担忧。但做下来的结果大大高出了我们预料,机能照旧相当不错的。” 王丙强说。

  据相识,针对BWA,华大基因抽调了应用规模软件的专家和英特尔高机能计较方面的专家配合介入项目,回收了许多高机能计较优化算法,如多线程负载均衡、线程调治、内存分派等,取得很是好的结果。据先容,整体机能提高了一倍还多,表示相当不错。

  王丙强暗示,对整个项目有两点印象深刻:一是本来许多同事并不看好BWA在MIC上的表示,但实际结果很好,让人印象深刻。第二,所需要的代码修改量不大,因为本质在传统x86志强处理惩罚器运行的措施,在MIC很容易移植,可以较量滑腻过渡,这也是GPU方案可以或许推广的重要原因。

  “许多时候并不需要修改源措施,一般科学计较,矩阵计较较量多,只不外是把本来在X86上运行的动态链接库,转由MIC来执行,整个软件不需要从头编译。” 王丙强说。

  结语

  我没有本领判定基因研究是不是正在摸索上帝造人的机密,但从科研的需求看,人类对付超等计较本领的需求是没有尽头的,就像先有路照旧先有车,必然是先有路。硬件领先软件是必需的,但就像英特尔MIC一样,兼容性是必必要思量的问题,是推广应用的要害。

  对付基因而言,当我们用超等计较机把所有的困难都解开的时候,谁人时候,也许我们才气够真正相识生命的机密!

来源: 网络转载  编辑: 网络转载编辑

 

更多>>本站推荐