|
|
| [硬件频道] | [导购] | [评测] | [行情] | [新品] | [知识] | [论坛] | [攒机推荐] | [模拟装机] |
以下为深圳华大基因研究院高性能计算部门和生物信息软件平台主管方林先生的案例讲解:
方林:大家下午好。很荣幸参加英特尔的至强7400系列服务器发布会。我主管的方向是高性能计算和生物信息软件平台开发。我接下来在两个方面和大家分享在7400平台上的一些测试成果。

深圳华大基因研究院高性能计算部门和生物信息软件平台主管方林先生进行案例讲解
我首先介绍一下我们单位。我们研究院从去年6月在深圳成立,在去年10月发布了MI1项目,这在中国是比较活动的一件事情,我们研究院是世界排名第三的测序中心和生物信息中心,每天的数据产出量大概在6个T左右,现在拥有一套10万亿次/秒,每天产出6T的数据。我们计划今年或明年年初,可能将高性能计算能力和存储能力提高了50亿万次/秒和5个P,争取在明年年底争取做到百万亿次,存储能力提高到10P。
我首先从高性能计算方面介绍一下7400平台对于我们生物信息计算方面的意义。
(图)我们这边给出的一个数据,是生物信息分析方面的一个关键应用:基因组的拼接。比如说把一个人的基因组比喻成一本书,我们测出来的序列基本上就是一个字或者一个句子,我们通过计算的方法把这些零散的字或句子按照书原来的顺序做成完整的书。拼接的应用对于高性能计算方面的要求是最高的。所以内存的需求非常高,像人类的基因组要求128G内存以上的机器,对于I/O的需求也很高,每天6T的数据对于I/O的要求非常高。对于计算机CPU的要求也非常高。这里只举了一个数据相对较小的,我们为了横向比较数据,就在7400平台上跑了一个“戏剧的基因组”,大概在7M上,在7400、7300和5300上分别跑一次,绿色圆圈就是7400的效果,效果可以看出7400和7300相比在性能上有10%的提高,和5400相比,提高得更多。
生物信息的应用对于内存的要求非常高,还有一些跨平台的需求也比较大。7400系列,既然是主推虚拟化,在生物信息方面的应用也会非常广泛。
(图)workbench开发的虚拟化。它是一个可视化的分析平台,这必然带来一个问题,开发和测试过程中对机器要求非常高,在5400系列上16G或者32G内存的机器根本不用,现在引入了7400平台,就可以大大简化我们的开发模式,在没有引入7400系列的时候,大概需要5台-10台5400机器做开发工作,引入了7400系列平台以后,就可以压缩在一台上做,这样降低了能耗、节约了成本,给用户带来的意义非常大。
总的来说7400平台在高性能计算和虚拟化技术方面对于IT发展起到非常有意义的促进作用。谢谢大家。