高性能计算与基因测序竟然如此亲密

来源:比特网 发布时间:2018.09.17
33.1K

高性能计算可以做什么?天气预报、汽车碰撞模拟、工业设计以及基因测序等等,相比之下基因测序的市场增长飞快,从2007-2013年复合增长率为33.53%,它不仅仅是一个科研项目,而是从实验室逐渐走向大众市场。

相比其他行业,基因测序所需要的计算、内存以及数据存储量都非常大,因此高性能计算机必不可少。

基因测序给高性能计算提出新挑战

诺禾致源在全球运行25台NovaSeq、20台PacBio Sequel、30台HiSeq X、11台HiSeq 2000/2500/4000、4台MiSeq、4台NextSeq 500、6台Life Ion Proton(DA8600)、2台S5XL和5套Q Exactive HF-X等最先进的基因测序仪,建立了亚洲通量规模最大的基因测序平台,将实现每年280,000人全基因组测序的超高通量。

成立于2011年3月的诺禾致源最初以科技服务为主。2012 年,诺禾致源开始拓展肿瘤基因检测服务。发展至今,诺禾致源业务已经覆盖科技服务、肿瘤基因检测及遗传检测三大领域。

诺禾致源副总裁吴俊表示,基因测序在几年前,需要7-8天才能完成,测试一次需要一万人民币。随着技术的飞速发展,现在做一个人的基因测序只需2.5天,只需1000美金。之所以说数据量大,是因为一套测序完成后要有6TB数据需要存储,对于存储的挑战也是非常之大。

诺禾致源借助联想超算实现业务跨越

中国测序行业在全球范围内占10%,而欧洲20%多,美国50%多,整个行业数据量是非常大的。基因测序技术发展了40年,但软件还在不断的升级过程中。所以在算法上还没有得到完全的优化,数据量又这么大,这是整个行业面临的问题。

对于生物行业来讲,对计算的要求非常高,机器计算的配置要足够的优化。另外数据量比较大,还要将数据收回,这就意味着每一次成本都非常高,同时IO的读写速度也要跟得上。

因此,一套高稳定、高性能的系统才能够使生物信息学应用更加方便快捷,同时也能够高效率的处理数据,保证业务不中断。

诺禾致源采用联想统一的集群监控管理,作业调度,结合联想高性能的服务器,从各个方面保证了整套系统的稳定性,大大提高了用户的使用稳定性和减少了故障率,为用户提高生产力提供持续不间断的支持。

医药行业高性能计算应用潜力巨大

“医药是我们现在能看到的最完整的一个产业链。”联想数据中心业务集团制造行业总监许子牛这样认为。所谓最完整产业链指的是技术需求从研发开始,生物制药需要研发系统、数据存储,包括光谱分析,成分分析、药动力分析,再过渡到生产,生产非常严格,要通过各种认证以及保质期等等。

可以设想一下未来,基因测序的模式一定会变,不会再把血样直接送到某个中心去,而是前端一定会做预处理,真正的分析工作才是核心价值。预处理完数据,做分析的时候才传输到相应的系统里。

为什么我们会关注边缘计算?因为未来社会一定是把简单数据的处理放在前端,后端去做前端做不了的事情。所以,未来的普及一定是基因测序业务模式的改变。为什么我们现在很关注边缘计算,因为在很多领域全部都是这样的,比如钻井的时候会产生不同的数据,以前专家在现场,现在专家不在现场,通过各种传感器的数据传到前端的计算机,做预处理,把这些数据通过卫星传到总部,由总部的专家指导。

目前联想研究院正在整合边缘计算的整体方案,从物联网到前端计算平台设计,对医疗行业联想也在思考,也希望能在这方面发力。

联想HPC为诺禾致源提供计算存储支持

目前,联想提供的刀片式高性能运算系统,提供了将近200万亿次计算能力,配置超过10PB的存储空间。本套集群很好的承载了诺禾致源华东地区的业务,有效的改善公司在华东计算资源不够的限制。

据相关资料显示,诺禾致源已经拥有全球领先的高性能计算平台,数据中心运算能力已提升至1727T flops,总内存410TB,总存储60.2PB,有效地支撑着生命科学研究和医疗健康两大领域对大数据分析和存储的需求。

未来,基因学研究将成为医疗领域的热门项目,而高性能计算机则承担着像医疗器械一样重要的职责,面对海量的数据处理及存储,你准备好了吗?

(作者:佚名 编辑:ahtianen)


上一篇:中国工程院院士王小谟:要考虑如何创造一个全新安全可控网络

下一篇:特斯拉的软件与颠覆,下一家震惊世界的公司是谁?

合作伙伴

合作伙伴

扫码立即关注