记者从中国科学院获悉:近日,中国科学院自动化研究所多模态人工智能系统实验室杨戈团队与中国科学院生物物理研究所蛋白质科学研究平台生物成像中心孙飞团队合作,以人工智能技术赋能原位结构生物学,提出了一种基于弱监督深度学习的快速准确颗粒挑选方法DeepETPicker,相关研究成果发表于《自然・通讯》。
生物大分子(如蛋白质)的结构与功能会随着细胞生理状态的变化不断进行动态调整。原位结构生物学是在接近自然生理状态下研究生物大分子结构和功能的科学,而原位冷冻电镜技术以其高分辨率和在接近生理条件下观察样品的特点,成为原位结构生物学研究中的关键手段。原位冷冻电镜的技术流程涉及样品制备、数据采集、电子断层重建、颗粒挑选、粒子平均等多个步骤。生物大分子的颗粒挑选,即定位识别,是其中一个关键环节。但受限于重建伪影等因素,成千上万个目标颗粒的手动挑选极为耗时费力,现有自动挑选方法的应用又受到人工标注量高、计算成本高和颗粒质量不理想等多方面限制。
据介绍,DeepETPicker仅需要少量人工标注颗粒进行训练即可实现快速准确三维颗粒自动挑选。为降低对人工标注量的需求,DeepETPicker优选简化标签来替代真实标签,并采用了更高效的模型架构、更丰富的数据增强技术和重叠分区策略来提升小训练集时模型的性能;为提高颗粒定位的速度,DeepETPicker采用GPU加速的平均池化-非极大值抑制后处理操作,与现有的聚类后处理方法相比提升挑选速度数十倍。此外,为方便用户使用,项目团队推出了操作简洁、界面友好的开源软件以辅助用户完成图像预处理、颗粒标注、模型训练与推理等操作。
据了解,研究团队将DeepETPicker与目前性能最优的颗粒挑选方法在多种冷冻电子断层扫描数据集上进行了性能评估对比,结果表明,DeepETPicker在仿真与真实数据集上均可实现快速准确的颗粒挑选,其综合性能明显优于现有的其他方法,生物大分子结构重建达到的分辨率也达到采用专家人工挑选颗粒进行结构重建同样的水平,这进一步体现了DeepETPicker在原位高分辨率结构解析中的实用价值。DeepETPicker将为采用原位冷冻电镜技术的原位结构生物学研究提供有力的支持。(经济日报记者 沈慧)