2024年11月10日,由中国计算机学会主办的“2024物博会专题活动—第15届CCF太湖论坛—自主可控人工智能创新技术大会暨2024山水东路科创谷对话”在我市隆重召开,本次大会上,国家超级计算无锡中心的产业化公司神威数智(无锡)科技有限公司联合国家超算无锡中心发布了对标DeepMind发布的AlphaFold3的国产大模型—SWBind,SWBind在常规的小分子配体、核酸分子(包括DNA和RNA)以及蛋白质的结构预测精度上能与AlphaFold3相媲美,并在模型置信度上达标。当前应用已正式发布并进入公测试用阶段,为用户提供了充分的机会来测试模型的性能,评估其在实际研究中的适用性和价值,截至目前,已获得数十家国内院校、研究院所的密切关注并反馈良好。
会议现场图
神威数智CTO 技术总监
呼思勒
SWBind是国内成功复现 AlphaFold3的成果,其性能与AlphaFold3相媲美。SWBind可以对蛋白质、DNA、RNA 等大分子及小分子进行建模,并模拟其化学修饰。通过扩散方法,模型从原子噪声图像逐步降噪,生成分子结构的3D坐标,从而实现对分子结构的精准预测。SWBind采用成对残基关系编码器,处理成对表示和单一表示,大幅提升了对复杂生物分子相互作用的建模能力。
在数据方面,SWBind的训练数据来源广泛,涵盖了蛋白质、核酸、小分子和金属离子等多种结构数据,并结合了我们自主研发的高质量大规模数据集 BindingNet,使得模型具备了卓越的生物分子系统处理能力。SWBind模型在实际成果展示中表现突出。在小分子配体复合物结构预测方面,使用PoseBusters数据集进行测试,其成功率甚至超过了依赖已知蛋白质结构的方法,预测结果与Alphafold3不相上下;在评估分子内部和分子之间合理性指标时,通过率在几乎所有任务上都超过了90%。在核酸复合物结构预测领域,尤其是在CASP15的RNA样本测试中,SWBind模型在无人为干预的情况下,平均精度超越了AlphaFold3。在蛋白质复合物结构预测任务中,与同类模型对比,其Docka分值表现优异,展现出强大的竞争力。研究人员借助SWBind高性能计算线上服务,仅需几步简单的点击操作,就可以通过SWBind对蛋白质、DNA、RNA、选定配体等组成的复杂生物分子结构进行建模,预测蛋白质与细胞内其他分子的相互作用,协助研究者制定新的研究假设与验证,加速研究与开发流程。即便是没有广泛计算资源或深厚机器学习背景的研究者,也能轻松上手。在本次会议中,国家超级计算无锡中心副主任赵文来副主任提到,异构众核架构在运行效率上的纸面数据较优,且在实际应用中,由于架构的差异,众核的实际效率相较于传统的x86+GPU组合表现出更大的优势同时,对于实时推理和跨学科协作研究,对并行计算能力和灵活云端算力的需求也在不断增加。因此,异构集群和算力基础设施建设已经成为推动科技发展进步不可或缺的基础支撑。神威数智依托国家超级计算无锡中心的强大异构算力基础,构建了NSCCWX 新药研发平台。该平台结合了太湖之光A+超算平台的卓越计算能力,以及高效的软件和数据资源,形成了完整的创新研发环境。平台包含基于物理学原理的层级虚拟筛选策略(SW-DOCK)、自研的SWBind AI大模型,以及包含约80亿分子的超大规模虚拟化合物库,涵盖公共和自建数据库。 国家超级计算无锡中心副主任
赵文来
SWBind是神威数智在依托国家超级计算无锡中心“太湖之光A+”智能超算系统提供的强大计算资源支持上,基于生物计算方向上的工作,很高兴和大家分享现阶段性的成果。SWBind团队秉持着开放与合作的精神,已经将该模型的试用版本发布(试用链接:http://swbind.thuwaytec.com/)(或点击网站首页图进入),诚挚欢迎各科研机构的专家学者、企事业单位的研发人员前来试用反馈,共同推动AI生物计算领域迈向新的辉煌。