在一项可以显著加快生物技术和医学研究步伐的开创性研究中,美国麻省理工学院的一个研究团队公布了一种新的计算方法,该方法旨在改变蛋白质优化。这种利用人工智能的创新方法专门针对增强蛋白质功能,改变了该领域传统上采用的费力和耗时的方法。
蛋白质工程是现代生物技术的基石,涉及一丝不苟地设计蛋白质,以实现新的或改进的功能。这 些工程蛋白质是推进药物开发、环境可持续性和我们对生物过程的理解的关键。然而,蛋白质结构的复杂性,加上巨大的潜在氨基酸序列,使优化成为一项艰巨的挑战——直到现在。
麻省理工学院团队的研究在将在最近发表的一篇论文中进行了详细说明,介绍了基于图平滑(GGS)的吉布斯采样(Gibbs Sampling with Graph-based Smoothing),这是一种将基于图的平滑与吉布斯采样相结合的方法,以预测有益的蛋白质突变。这种方法不仅简化了优化过程,还大大提高了识别高健康蛋白质变体的效率。
计算生物学的飞跃
GGS方法的核心是应用图信号处理来平滑蛋白质的适应性,促进对可能的突变进行更有效的探索。研究人员解释说,蛋白质设计是一个难题,因为从DNA序列到蛋白质结构和功能的映射非常复杂。GGS方法通过创建最佳蛋白质配置的可导航地图来简化这种复杂性。
这种方法在两种蛋白质上进行了测试:绿色荧光蛋白(reen fluorescent protein,GFP),通常用作研究中的生物标志物,以及一种来自腺相关病毒( adeno-associated virus,AAV)的蛋白质,这些都对基因治疗应用至关重要。结果令人震惊,GGS方法在优化GFP序列方面实现了2.5倍的适应性改进——这证明了其彻底改变蛋白质工程的潜力。
GGS方法的特点
GGS方法与传统方法的不同之处在于,即使初始数据有限,它也能高效运行。这是蛋白质工程的游戏规则改变者,在蛋白质工程中,收集大量实验数据往往是不切实际且昂贵的。通过利用在平滑合适的景观(smoothed fitness landscape)上训练的卷积神经网络(CNN)模型,GGS方法能够系统地探索突变空间,以识别以前无法访问的有益突变。
此外,使用基于图的平滑来为优化算法创建更可导航的合适景观,这代表了该领域的一种新方法。研究人员评论说,这项工作体现了人类作为科学发现特征的偶然性,强调了将来自不同背景的研究人员聚集在一起应对这一挑战的合作精神。
影响和未来方向
GGS方法的影响远远超出了GFP和AAV蛋白质的直接改善。它的广泛适用性表明,这是解决各种蛋白质工程挑战的强大工具,从开发更有效的药物到设计可以 分解塑料废物的酶。
展望未来,研究人员计划将GGS方法应用于其他蛋白质,旨在用他们的计算模型超越几十年的人工实验。参与这项研究的研究人员说,数十个实验室已经研究了二十年,但仍然没有比这更好的了。该团队的雄心壮志是明确的:利用他们的计算技术来突破蛋白质工程中可能的界限。