随着新一代高能同步辐射光源(北京光源)的正式运行,以及人工智能在生命科学领域的广泛应用。基于晶体衍射的结构生物学与药物发现迈入了海量数据的时代,传统的低效、高耗时的分步式数据处理与结构解析方法,成为了制约相关研究工作高速发展的关键瓶颈。
针对这一问题,中国科学院物理研究所/北京凝聚态物理国家研究中心软物质物理实验室SM0组的丁玮工程师与中国科学院高能物理研究所的齐法制团队、郝权团队合作,指导博士生张鑫(香港大学),共同打造了一款具有核心知识产权、高通量的生物大分子晶体衍射数据处理和结构解析软件“AutoPD”。为新一代高能同步辐射光源提供了在线的、高效的数据处理方案,亦为国内结构生物学研究和药物发现提供了高效的自动化结构解析策略。
该软件整合了多项前沿技术与方法,包括:先进的并行计算方法、基于人工智能结构预测的快速分子置换方法、以直接法为核心的双空间迭代建模框架,以及自适应的最优建模路径选择技术,使得AutoPD实现了从原始衍射数据到高精度三维结构模型的全自动高效运行。在186组基准测试中,AutoPD的解析成功率超过92%。这充分展现了AutoPD的稳定性和可靠性,同时也为自动化结构解析树立了新的标杆。“AutoPD”已经部署在北京光源的Daisy系统中,将为广大的线站用户提供高效的数据处理与结构解析服务。
相关研究成果发表在著名的晶体学杂志Journal of Applied Crystallography 上(https://doi.org/10.1107/S1600576725003218),标题为:AutoPD: an integrated meta-pipeline for high-throughput X-ray crystallography data processing and structure determination。丁玮工程师、齐法制研究员、郝权研究员为本文通讯作者,博士生张鑫为第一作者。中国科学院高能物理研究所的孙浩凯、胡誉、耿直、高增强,中国科学院物理研究所的李增茹,为软件的设计和测试做出了重要贡献。该工作获得了国家自然科学基金、广东省基础与应用基础研究重大项目和中国科学院的支持。
图1、“AutoPD”的运行流程。