《2024 化学诺奖:AI 助力蛋白质预测,化学家仍不可或缺》
2024
年诺贝尔化学奖的揭晓,犹如一颗巨石投入平静的科学之湖,激起层层波澜。今年的奖项授予大卫・贝克、德米斯・哈萨比斯和约翰・詹珀,表彰他们在使用机器算法解读蛋白质结构方面的巨大贡献。这一决定不仅引发了科学界的广泛讨论,也让公众对蛋白质结构研究以及人工智能(AI)在科学领域的应用有了更深刻的认识。
蛋白质,作为生命的基石,其结构的解析一直是困扰科学家长达 50 年的难题。蛋白质由 20 个氨基酸排列组合成的长链折叠而成,不同的折叠方式决定了其功能。科学家们发现指导折叠的 “命令” 藏在氨基酸链条的序列之中,从此开启了漫长的探索之旅。与此同时,计算机科学中神经网络的研究也在同步发展,科学家们一直尝试利用这种技术来计算氨基酸序列和蛋白质结构之间的关系,但进展缓慢。
然而,在 2010 年之后,神经网络技术迎来重大突破,从浅层网络变成 “深度学习” 和 “人工智能”,并能够完成复杂任务。同时,实验生物学家的努力和冷冻电镜等观测技术的发明,为深度学习提供了大量的数据基础。最终,复杂的蛋白质结构问题在 “人工智能” 时代迎来了重大突破。谷歌公司的哈萨比斯和詹珀创造的 AlphaFold 系列算法,以及蛋白质计算领域的先驱者贝克开创的 “从头设计” 蛋白质的先河,为蛋白质结构研究带来了革命性的变化。
对于今年的诺贝尔化学奖颁给蛋白质结构问题以及 AI 相关工作,上海交通大学化学化工学院长聘教轨副教授沈琦认为,这是实至名归的。生命的奥秘不是孤立的,研究复杂生命过程需要多学科的交叉,而 AI 作为一种强力工具,为蛋白质结构研究提供了巨大的帮助。从蛋白质的一级结构到高级结构的预测,涉及到微观层面的物理化学知识,如力场等。蛋白质的折叠遵循 “能量最小化” 原则,科学家们可以通过计算分子间的相互作用力来模拟蛋白质的折叠和动态行为。因此,蛋白质结构问题的研究涉及生命科学、化学甚至物理等多个领域,而随着 AI 的出现,蛋白质预测的准确率和效率都得到了极大提高,解决了困扰化学家多年的重大科学难题。
然而,AI 虽然在蛋白质结构预测方面取得了巨大成就,但并不意味着它能够取代科学家的工作。沈琦指出,AI 在蛋白质结构预测领域还有很长的路要走。目前,AI 算法对我们彻底理解底层生物规律的帮助有限,它本质上是通过对大量数据的比对形成概率预测,对于蛋白折叠过程背后的科学规律认识还很有限。虽然 AI 预测蛋白质结构的准确率很高,但也不是完全精确,对于蛋白质的动态结构以及相互作用的预测表现差强人意。此外,AI 的成就离不开传统结构生物学家数十年的努力,没有他们通过实验解析得到的结构数据,AI 是无法训练的。而且,人类研究者在对问题的敏锐度上具有优势,能够很快地拥抱新技术助力研究。
总之,2024 年诺贝尔化学奖的颁发,既是对蛋白质结构研究的重大肯定,也是对 AI 在科学领域应用的高度认可。AI 作为一种强大的工具,为蛋白质结构研究带来了新的机遇和挑战,但化学家们并不会因此 “失业”。在未来的科学研究中,人类研究者和 AI 将相互协作,共同推动科学的进步。就像沈琦所说,一个好的技术最终要做到普及性,让大家可以像查手机地图那样简单地使用 AI 去预测蛋白。相信在不久的将来,随着技术的不断发展,我们将对生命的奥秘有更深入的理解。