1

百度飞桨螺旋桨HelixFold-Single入驻北鲲云ISV,蛋白结构预测达到秒级别!-品玩

 1 year ago
source link: https://www.pingwest.com/a/275033
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

百度飞桨螺旋桨HelixFold-Single入驻北鲲云ISV,蛋白结构预测达到秒级别!-品玩业界动态

百度飞桨螺旋桨HelixFold-Single入驻北鲲云ISV,蛋白结构预测达到秒级别!

ISV计划由北鲲云发起,秉承完全开放的生态策略,致力于与合作伙伴一起,为有高算力计算需求的用户提供多样且更具价值的极致应用,目前已同多家行业领先企业达成合作,为合作伙伴提供平台推广服务及专业技术支持。

在技术前沿探索中,百度智能云一直走在行业前列。今年9月,百度智能云全新推出的“云智一体3.0”架构,汇聚了百度在人工智能各个层面领先的自研技术,依托昆仑芯片、深度学习框架飞桨、文心大模型,打造了“芯片-框架-大模型-行业应用”闭环的智能化路径。

聚焦生命科学领域,百度智能云从生命科学行业核心场景切入,通过打造行业标杆应用,带动和沉淀高性价比的异构算力和高效的AI开发运行能力,进而向上可以优化生命科学行业已有应用、孵化新应用。目前百度智能云依托底层技术,全新赋能生命科学领域,形成涵盖小分子药物研发、蛋白药物研发、mRNA疫苗设计、精准医疗等生命科学领域综合解决方案,为生命科学领域构建超强“算力”和“智力”;再结合百度网盘企业版提供的企业极速共享空间、文件接收方极速下载、无限制预览等功能,为生命科学领域提供多维“数据”赋能。

百度飞桨螺旋桨携基于单序列的蛋白结构预测模型HelixFold-Single正是在蛋白药物研发方面的成果,近期也已经成为了成为北鲲云ISV计划合作伙伴。通过北鲲云超算平台对外提供服务,助力生物医药客户创新蛋白质药物研发,进一步提升药物研发的智能化水平。

北鲲云致力于为客户提供多样且优质的云计算服务,打造健康、完整的云生态圈。作为生物医药研发的重要理论基础,计算生物学成为人工智能发展的重要应用场景之一。通过人工智能的方法,HelixFold-Single能帮助用户极大地提升结构预测的速度,模型推理的速度平均提升数百倍。

article-body

NVIDIA A100(40G) GPU 单卡测试结果

在计算效率极大提升的同时,HelixFold-Single模型在精度上也不输AlphaFold2,甚至在MSA更深的蛋白上表现比AlphaFold2更优。这也从侧面论证了,模型通过调大参数可以从海量蛋白质数据中学习到共进化信息,不用MSA也可以精准预测蛋白的三级结构信息。

article-body

HelixFold-Single预测的蛋白结构(紫色)、AlphaFold2预测的蛋白结构(绿色)和实验测量的蛋白结构(蓝色)对比

除了HelixFold-Single, 此前百度飞桨螺旋桨团队发布的HelixFold也同样支持在北鲲云平台上使用。HelixFold是团队在国产平台上实现的基于MSA的蛋白质结构预测算法,围绕着显存峰值、训练速度、分布式策略进行了全面的性能优化。通过与原版 AlphaFold2 模型和哥伦比亚大学 Mohammed AlQuraishi 教授团队基于 PyTorch 复现的 OpenFold 模型的性能对比测试显示,HelixFold 模型的训练性能相比 AlphaFold2 提升106.97%,相比 OpenFold 提升104.86%。

article-body

HelixFold 与 AlphaFold2、OpenFold 端到端训练速度对比

在性能大幅度提升的同时,HelixFold 从头端到端完整训练可以达到和AlphaFold2 论文媲美的精度。在包含87个蛋白的 CASP14 数据集和包含371个蛋白的 CAMEO 数据集上,HelixFold 模型 TM-score 指标分别达到0.8771和0.8885,与原版 AlphaFold2 准确率相当甚至更优。

article-body

HelixFold 与 AlphaFold2 精度对比

此次双方合作,除ISV计划外,在行业智能化升级的深化过程中,百度百舸支持在生科医疗以及智算中心等领域作为AI基础设施,提供普惠多元的AI算力。比如,将药物蛋白质结构预测模型的训练效率提升了2倍,更加极致的满足了产业智能化的AI算力需求。

北鲲云产品围绕CLOUD-HPC,从IaaS层到PaaS层到SaaS,形成全套的解决方案。在IaaS层,围绕高性能对基础设施的特殊要求,形成一套弹性的算力调度系统和一套高性能的并行文件系统;在PaaS层,基于通用、便捷、智能的作业调度系统和公共服务,打造一站式高性能计算平台;在SaaS层,深入行业领域,将行业需求结合到产品设计中,同ISV合作伙伴整合形成一体化解决方案,提高资源利用率,提供行业级别的云平台。

北鲲云作为Cloud-HPC的先行者,已为上千家企业提供高性能计算解决方案,此次百度HelixFold和HelixFold-Single的入驻,双方将依托各自优势,聚焦生命科学,以自主可控为抓手,在蛋白结构预测等细分领域展开合作,成为云上高性能计算新引擎,为客户带来更好用更高效的蛋白结构预测服务。

北鲲云创始人兼CTO李青松表示:“此次与百度飞桨的合作双方将结合各自的优势,助力生物医药客户创新蛋白质药物研发,进一步提升药物研发的智能化水平。 同时我们也在努力打造更完善的合作伙伴生态,通过企业价值平台建设,整合内外部资源,形成新的生态优势。价值的创造和获取来自产业链上下游之间的合作伙伴和客户共同创造,同时我们也希望能有更多类型的ISV及开发者能够参与到北鲲云合作伙伴生态当中。”

百度智能云GTM副总经理张玮表示:“此次百度与北鲲云的深度合作,北鲲云拥有非常专业的技术团队,利用百度智能云的基础资源,通过北鲲云提供调度平台能力,能够在短时间内,集成百度飞桨螺旋桨行业领先的模型,为生命科学行业用户提供On-Demand服务。”


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK