昇思MindSpore蛋白质结构预测模型拿下CAMEO全球预测竞赛第一
2022-04-24
来源:电子创新网
近期,华为与昌平实验室、北京大学生物医学前沿创新中心(BIOPIC)和化学与分子工程学院、深圳湾实验室高毅勤教授课题组及鹏城实验室陈杰团队基于全场景AI框架昇思MindSpore开发的蛋白质结构预测模型,在全球持续蛋白质结构预测竞赛CAMEO(Continous Automated Model EvaluatiOn)获得全球第一的好成绩。这显示出昇腾AI基础软硬件平台在 AI+科学计算 领域的强大能力。
4月21日最新月榜竞赛结果
超越业界标杆,连续三周保持全球第一排名
蛋白质结构预测是人工智能走进生命科学的关键成果之一,对生物学研究意义重大。2020年12月,《科学》杂志评选了该年度十个重大科学突破,蛋白质结构预测的人工智能AlphaFold就是其中非常重要的一项,因此AlphaFold成为生物研究领域的标杆成果,更是一块重要里程碑。
昇思MindSpore蛋白质结构预测模型研发进展
2021年11月,华为昇思MindSpore团队与昌平实验室、北京大学生物医学前沿创新中心(BIOPIC)和化学与分子工程学院、深圳湾实验室高毅勤教授课题组联合推出基于AlphaFold2算法的蛋白质结构预测推理工具,并在2022年2月实现训练的全流程打通,效率同比提升2-3倍。
采用昇腾AI基础软硬件平台后,在混合精度下,单步迭代时间由20秒缩短到12秒,性能提升超过60%。依托昇思MindSpore内存复用能力,训练序列长度由384提升至512。
在训练精度接近AlphaFold2的基础上,昇思MindSpore在算法、规模和软硬件支持等方向上持续改进,本次发布的蛋白质结构预测模型成绩持续刷新业界记录、拿下CAMEO竞赛第一,是昇思MindSpore在蛋白质结构预测领域的又一里程碑,在填补国产人工智能基础软硬件在蛋白质结构预测领域成绩空白的同时,更加证明了其价值与优越性。
由瑞士生物信息研究所和巴塞尔大学联合举办的 CAMEO(Continous Automated Model EvaluatiOn)——全球持续蛋白质结构预测竞赛,被认为是蛋白质结构预测领域最重要的比赛之一。CAMEO 竞赛的规则是,每位参赛者需每周对 20 个由世界范围内的结构生物学家最新破解出的蛋白质结构进行预测,其分数和名次每周都会进行在线更新。
该竞赛吸引了众多世界范围内生物计算领域的前沿模型“选手”基于昇思MindSpore AI框架训练的蛋白质结构预测模型,一经亮相,便领跑全球。在最近的三周CAMEO竞赛中持续排名第一,意味着昇腾AI基础软硬件平台在AI for Science领域的强大能力。
未来,针对蛋白质结构预测问题,昇思MindSpore将携手学术科研界更多合作伙伴,在蛋白质结构预测领域共同探索、持续突破,助力国内相关基础研究,尤其是生命各分支学科的进步,推动创新制药行业的发展。