兆芯CPU助力实现大规模基因测序数据高效能分析

发布日期:

2022-05-17 14:21:28

来源:

兆芯

日前,兆芯携手承启生物,基于承启生物自研FANse算法,成功以不输国际主流处理器平台的速度,在开先KX-6000系列处理器平台上运行了高性能分析大规模基因测序数据。该成果的顺利达成意味着精准医学基因测序领域的纯国产流程得以实现,并帮助我国在生物学研究、遗传病诊断、流行病溯源等领域进一步强化底层基础,赢取高质量发展的主动权。



携手创新 破局大规模测序“卡脖子”难题


兆芯CPU助力实现大规模基因测序数据高效能分析


大规模测序,又称新一代测序、二代测序,是指将DNA或RNA打断成许多小片段进行平行测序,一次测序即可得到几百万至几亿个小片段的核酸片段序列信息,在生物学研究、疾病诊断、流行病溯源等领域有着广泛的应用。


但在这个过程中产生的海量数据必须经过大量运算才能得到具有生物学意义的结论,通常需要很强算力的计算机或服务器花费数小时才能给出结果。然而,高性能CPU和GPU高度依赖进口,让业内不得不产生被国外断供“卡脖子”的忧虑,而且,对于一些对安全性有极高需求的领域,使用非自主CPU开展基因测序还有可能存在泄密的风险。


兆芯CPU助力实现大规模基因测序数据高效能分析


承启生物一直深耕生物信息国产化处理技术,自研的纯国产高性能大规模测序比对算法FANSe率先实现了规模化商用,该算法可以根据不同CPU的特性进行针对性优化,2020年还曾创下单机5分钟分析完一个30X人全基因组测序数据集的世界纪录,并一直保持至今。



大规模测序应用表现追平国际主流


兆芯CPU助力实现大规模基因测序数据高效能分析


兆芯携手承启生物,针对兆芯开先KX-6000系列8核处理器平台国产计算机和非国产服务器进行了大规模测序性能测试。两款设备均部署于承启基因测序分析云平台,使用FANSe算法,在常见的转录组、翻译组、细菌菌群宏基因组等应用中,8核8线程,CPU主频2.7GHz的国产计算机的实际应用表现与非国产高性能服务器(双路E5V3,28核56线程)基本相当,最小差距仅1%。在大规模测序数据处理应用上,国产计算机的实际应用性能第一次几乎追平了国际主流服务器。


此前,承启生物联合合作伙伴发布了国产大规模测序的全流程,致力于将测序仪、试剂、分析算法等全面实现国产化。自研的FANSe算法在纯国产整机上成功运行,标志着我国基因测序的安全性和自主性达到一个全新的高度,同时也标志着国产计算机不仅能支撑诸多精准医学应用,更在检验检疫、流行病控制、生物战防治、法医鉴定等直接关系到国家安全的领域拥有了大显身手的能力与空间。




| 文中产品介绍及图片均来自兆芯合作伙伴

如有后续更新恕不另行通知,如涉侵权请告知我司予以删除 |