转自:中国医药报
□ 马剑鹏
自发布以来,AlphaFold2在蛋白质结构预测方面取得了相当大的成功,引发了广泛关注。然而,关于AlphaFold等蛋白质结构预测工具对于药物发现的实际意义存在广泛争论。如何利用AlphaFold为药物发现提供更多帮助,AlphaFold在哪些药物发现问题上表现得更好,在哪些方面还有待提高?
蛋白质
结构测定的挑战
蛋白质结构在水溶液中可以呈现多种构象,并且在与其他分子相互作用时发生结构变化。捕捉和理解这些动态变化对于揭示蛋白质的功能至关重要,然而技术水平的不足会从很大程度上限制蛋白质结构解析的准确率
蛋白质结构测定是生物学和生物医药研究中的一个重要领域。虽然X射线晶体学、核磁共振(NMR)和冷冻电镜(Cryo-EM)等技术对很多蛋白质来说,已经能够提供相对高分辨率的结构图像,但蛋白质结构在水溶液中不是静态的,它们可以呈现多种构象,并且在与其他分子相互作用时发生结构变化。捕捉和理解这些动态变化对于揭示蛋白质的功能至关重要,然而技术水平的不足会在很大程度上限制结构解析的准确率。即使是刚性度比较大的蛋白质,想要获取其高精度的结构图像,现有的实验手段也存在较大误差。某些蛋白质,特别是那些难以形成稳定晶体、尺寸过大或过小以及不能形成稳定结构的蛋白质等,仍然难以获取高质量的结构。
人工智能和机器学习技术的引入,为提高蛋白质结构预测的速度和准确性提供了助力,开启了结构生物学研究的新篇章。AlphaFold等AI方法在很多方面弥补了传统实验方法在测定蛋白质结构中的不足,可以在短时间内预测蛋白质的结构,大大降低了时间和经济成本。对于一些难以通过传统方法获得结构的蛋白质,例如难以形成稳定晶体的蛋白质或某些大型膜蛋白,使用AI方法预测蛋白质结构能够不依赖于蛋白质的物理样品,从而绕过传统方法的一些限制。
随着技术的发展,尤其是深度学习在蛋白质结构预测中的应用,AI方法在精度上取得了显著的进步。例如,AlphaFold2在2020年的Critical Assessment of Structure Prediction(CASP) 竞赛中展示了前所未有的高精度预测能力。AI方法可以作为传统实验方法的辅助工具,通过预测结果指导实验设计。
尽管AI方法在蛋白质结构预测方面取得了显著成果,但也存在着局限性。比如,对于序列同源性较高的蛋白,侧链建模精度依然存在较大误差;对序列同源性低的蛋白,总体预测精度依然不高。
需要特别强调的是,蛋白质侧链建模精度是蛋白质结构预测研究领域的核心,所有蛋白质结构建模问题的精确度,如蛋白质折叠、蛋白质-蛋白质相互作用、蛋白质-配体相互作用、氨基酸突变、蛋白质进化等,都与侧链建模的准确性有关。此外,对于极端复杂的蛋白质、动态结构或是蛋白质复合体的预测等,AlphaFold2也存在局限性。
值得注意的是,在面向生物制药等实际应用领域,AlphaFold2等预测手段和传统实验方法往往是互补的,预测手段并不能取代实验结果。因为药物设计是一项十分精细的技术,很小的结构误差可能会导致巨大的偏差,预测手段和传统实验方法结合才可以更全面地解决蛋白质结构测定的问题。
AlphaFold
在药物发现中的应用
使用AlphaFold预测蛋白质的三维结构,可以帮助研究者理解未知或未被充分研究蛋白质的功能,发现新的药物作用靶点或验证现有的靶点。在使用时,研究者应注意将预测模型与实验结果相结合,以验证和优化预测结果
AlphaFold通过预测蛋白质的三维结构,可以帮助研究者理解未知或未被充分研究蛋白质的功能,发现新的药物作用靶点或验证现有的靶点。
虽然AlphaFold已经可以较为精确地预测高同源性靶点蛋白的三级结构,但是无法考虑到靶点蛋白的周围环境信息,如结合配体等,而这些信息对药物设计极其重要。此外,靶点蛋白与药物的结合是一个动态过程,蛋白质的结构会随着该过程的进行而发生一定变化,而对该变化的模拟也是AlphaFold所欠缺的。
在使用AlphaFold等AI工具预测的蛋白质结构进行基于结构的药物设计时,研究者应当注意验证和参考实验数据。对于重要靶点,应优先考虑已有实验结构或使用实验方法进一步验证关键部分的结构。蛋白质不是静态的,它们可以在多种稳定或亚稳定的构象之间转换,理解和考虑这种动态性对于识别药物分子的结合位点、改善药物分子的亲和力和选择性等都至关重要。在缺乏实验验证的情况下,应谨慎对待预测结构的细节,避免过度解释可能的误差或不确定性。
此外,在设计药物时应避免过度优化对预测模型特定细节的配合,以免造成“过拟合”。可以结合使用多种预测工具和实验技术,例如将AlphaFold预测的结构与实验数据、其他预测模型的结果等结合,以获得更准确的蛋白质三维结构。
最终,所有基于预测结构的设计都需要通过生物学实验进行验证,包括靶标的结合亲和力测试、细胞活性测试、动物模型研究等,以确保预测结构的实用性和药物分子的有效性。
活性位点是药物研发人员非常关注的区域,通常是蛋白质上的特定小区域,负责与底物、抑制剂或其他蛋白质相互作用。AlphaFold的预测可以精确地描绘出蛋白质的整体构型,包括可能的活性位点区域。如果整体结构预测是准确的,那么活性位点区域的结构也有望被准确预测。然而,对于某些蛋白质,特别是那些灵活的或未充分特征化的蛋白质,预测的准确性可能会下降,并且确定一个区域是否为活性位点通常需要更多的功能性和生物化学数据。
在实际应用中,药物研发人员可以结合使用AlphaFold和其他方法来识别和验证活性位点,比如突变分析、结合实验,以及分子对接、动态模拟等其他计算方法。除了结构预测之外,通常还需要对蛋白质进行功能注释,确定可能的活性位点、配体结合区和蛋白质相互作用界面。
在药物发现中,使用AlphaFold模型预测药物/配体结合模式的准确性是研发人员非常关注的问题。使用AlphaFold模型或类似的AI结构预测工具来预测药物或配体的结合模式,其准确性取决于多重因素,包括模型的预测能力、蛋白质和配体的特性,以及结合模式的复杂性。蛋白质在与药物或配体结合时可能会发生显著的构象变化,这种“诱导配合”(inducedfit)现象意味着静态的蛋白质结构可能无法完全揭示药物结合时的真实状态。有些药物或配体可能会通过与蛋白质结合改变其结构,特别是在与多个亚单位或复杂结构域相互作用时,AlphaFold通常不能直接预测这些效应。在实际应用中,AlphaFold提供的蛋白质结构通常与分子对接和分子动力学等其他计算方法结合使用,以更准确地预测和分析药物/配体的结合模式,提高预测的准确性和可靠性。
需要注意的是,任何预测模型都需要通过与实验技术的结果相结合来验证和优化预测结果。药物发现是一个综合性很强的领域,需要依靠跨学科的方法和多源数据的整合,以确保所发现的药物候选分子的效力和安全性。
AlphaFold
在药物发现领域的突破方向
AlphaFold对于捕捉动态性和复杂的蛋白质-蛋白质或蛋白质-小分子相互作用的能力有限;在预测这些修饰对蛋白质结构的影响方面有限;对于大型蛋白质复合物或非常复杂的蛋白质网络,其预测能力可能会降低。系统生物学、代谢途径、基因表达调控等方面的因素也对药物发现至关重要,而这些是AlphaFold目前无法直接解决的问题
AlphaFold能通过快速准确地确定蛋白质结构,更快地识别新的药物靶点,来加速药物的设计过程。对已知蛋白质结构的深入理解,可以帮助科学家发现现有药物的新用途。
AlphaFold的局限性和待改进之处主要是,对于捕捉这种动态性和复杂的蛋白质-蛋白质或蛋白质-小分子相互作用的能力有限;在预测这些修饰对蛋白质结构的影响方面有限;对于大型蛋白质复合物或非常复杂的蛋白质网络,其预测能力可能会降低。系统生物学、代谢途径、基因表达调控等方面的因素也对药物发现至关重要,而这些是AlphaFold目前无法直接解决的问题。
长远来说,以人工智能为基础的蛋白质结构预测,对于药物发现的意义是深远的,AlphaFold只是人们迈出的重要一步。
传统的药物发现过程通常耗时且成本高昂。人工智能的应用有可能显著缩短药物从发现到上市的时间,并降低相关的研发成本,尤其对于某些长期以来难以解析结构的蛋白质,如某些膜蛋白,人工智能方法提供了新的解决途径。这些蛋白质往往是重要的药物靶点,AI的应用可以促进这些领域药物研究的进展。除此之外,AI的应用还激励了计算生物学、结构生物学、药物化学等多个学科之间的合作,推动了这些领域的综合发展。
(作者系复旦大学复杂体系多尺度研究院院长)
下一篇:在国际组织实习是一种怎样的体验