与现有方法相比,该方法有几个重要优势。首先,它实现了序列空间的广泛,均匀且精确的采样,这可以快速探索高维并生成更多样化和功能性的突变体,并提供有关序列-功能映射的更丰富信息。其次,该方法整合了基于经验的进化扫描和深度学习模型,充分利用了这两种不同方法的优势。研究人员可以使用深度学习得到的关键特征来动态地指导扫描过程。可解释性深度学习在未来的进一步发展可能会揭示潜在的进化规则,并为蛋白质如何适应和克服进化限制提供见解。第三,该方法可以进化和研究缺乏结构信息或涉及具有挑战性的相互作用的蛋白质。EvoScan可以针对不同的蛋白质相互作用捕获蛋白质锚点,如蛋白质-蛋白质、蛋白质-配体和蛋白质-核酸相互作用。文章中提出的蛋白质序列-功能空间压缩的概念也有望应用于不同种类的蛋白质,并对自然界如何在有限时间内完成蛋白质空间的搜索和物种的高效进化产生一定的启发作用。
致谢
清华大学药学院博士生马梓源,李文杰,沈运浩及清华大学生命学院博士生徐运昕为论文共同第一作者,清华大学药学院张数一老师为论文通讯作者。清华大学生命学院龚海鹏老师与清华大学药学院田博学老师为该研究提供了极大帮助。该研究项目得到国家科技部重点研发计划,国家自然科学基金,清华大学笃实专项基金和北京生物结构前沿研究中心的资助。
参考文献
1. Fowler, D. M. & Fields, S. Deep mutational scanning: a new style of protein science. Nat. Methods11, 801-807 (2014).
2. Stiffler, M. A., Hekstra, D. R. & Ranganathan, R. Evolvability as a function of purifying selection in TEM-1 β-lactamase. Cell 160, 882-892 (2015).
3. Zheng, L., Baumann, U. & Reymond, J.-L. An efficient one-step site-directed and site-saturation mutagenesis protocol. Nucleic Acids Res.32, e115 (2004).
4. McLaughlin Jr, R. N., Poelwijk, F. J., Raman, A., Gosal, W. S. & Ranganathan, R. The spatial architecture of protein function and adaptation. Nature491, 138-142 (2012).
5. Cadwell, R. C. & Joyce, G. F. Randomization of genes by PCR mutagenesis. Genome Res.2, 28-33 (1992).
6. Vanhercke, T., Ampe, C., Tirry, L. & Denolf, P. Reducing mutational bias in random protein libraries. Anal. Biochem.339, 9-14 (2005).
7. Esvelt, K. M., Carlson, J. C. & Liu, D. R. A system for the continuous directed evolution of biomolecules. Nature472, 499-503 (2011).
8. Miller, S. M., Wang, T. & Liu, D. R. Phage-assisted continuous and non-continuous evolution. Nat. Protoc.15, 4101-4127 (2020).
9. Ravikumar, A., Arzumanyan, G. A., Obadi, M. K. A., Javanpour, A. A. & Liu, C. C. Scalable, Continuous Evolution of Genes at Mutation Rates above Genomic Error Thresholds. Cell 175, 1946-1957.e1913 (2018).
10. Halperin, S. O. et al. CRISPR-guided DNA polymerases enable diversification of all nucleotides in a tunable window. Nature560, 248-252 (2018).