-
生物通官微
陪你抓住生命科技
跳动的脉搏
打破合成生物学瓶颈的新程序
【字体: 大 中 小 】 时间:2016年01月07日 来源:生物通
编辑推荐:
最近,来自杜克大学的科学家们,开发出一种免费可用的计算机程序,通过该程序可以找到最少重复的遗传密码,来构建他们想要研究的分子。相关研究结果发表在2016年1月4日的《Nature Materials》。
生物通报道:最近,研究人员创建了一种计算机程序,将向全世界打开合成生物学的一个挑战性领域。延伸阅读:MIT牛人:新技术推动合成生物学变革。
在过去的十年中,研究人员为了开发一种技术,快速、廉价地读写DNA,以合成和操纵多肽和蛋白质,已经花费了数十亿美元的成本。
但是,当这种技术遇到重复的基因谱时会出错。这包括许多天然和合成的材料,适用范围很广,从从生物粘合剂到合成丝。就像有人与“不可能完成”的智力拼图斗争一样,当大多数构建模块看上去一样时,合成器就难以确定哪块遗传片段放在哪里。
来自杜克大学的科学家们,根据“旅行商问题(traveling salesman problem,是数学领域中著名的问题之一)”,开发出一种免费可用的计算机程序,消除了这个障碍。合成生物学家现在可以找到最少重复的遗传密码,来构建他们想要研究的分子。研究人员说,他们的这一程序将使那些具有有限资源或专门知识的人,很容易地探索合成的生物材料,这些材料曾经只能用于一小部分领域。相关研究结果发表在2016年1月4日的《Nature Materials》。
杜克大学生物医学工程系主任生物医学工程教授Ashutosh Chilkoti说:“合成并处理高度重复性的多肽,是一个非常具有挑战性且繁琐的过程,一直是进入该领域的障碍。但是在我们新工具的帮助下,过去研究人员花费几个月的工作,可以在线订购(价格100美元),并在几周内收到基因,从而使得重复性多肽变得更容易研究。”
每一种蛋白质和多肽都是以2个或多个氨基酸序列为基础的。一个氨基酸(称为密码子)的遗传密码是三个DNA字母。但是,大自然有产生20个氨基酸的61个密码子,从而意味着有多个密码子产生一个给定的氨基酸。
因为合成生物学家可以从多个密码子得到相同氨基酸,所以,他们可以通过互换不同的密码子达到相同的效果,从而避免繁琐的DNA重复序列。面临的挑战是,寻找最少的、但仍然能制造所需多肽或蛋白质的重复遗传密码。
Chilkoti说:“我一直认为,有一种潜在的解决方案,肯定有一种数学方法来弄清这一点。我以前给研究生提供了这个问题,但是没有人愿意去解决它,因为它需要将高级数学、计算机科学和分子生物学进行特别的组合。但是Nicholas Tang是正确的人选。”
在对这个问题进行详细研究后,Chilkoti实验室的博士生Nicholas Tang发现,解决方案是一个版本的“旅行商”的数学问题。这个经典的问题是,寻求单一旅行者由起点出发,通过所有给定的需求点之后,最后再回到原点的最小路径成本。
写出算法后,Tang对它进行了测试。他创建了一份清单,包含19个流行的重复性多肽,目前正在世界各地的实验室进行研究。将代码通过程序后,他通过商业生物技术outfits(一项任务,对于原来的任何一个代码都是不可能的),发送它们用于合成。
在没有商业技术的帮助下,研究人员花了几个月的时间构建了细胞用以生产正在研究的蛋白质的DNA。这是一项乏味、重复性的任务——对年轻的研究生来说不是最有吸引力。但是,如果新的程序起作用,这个过程可能会被缩短到几周的时间,而不是等待机器完成工作。
当Tang收到他的DNA时,它们每个被引入活细胞,以产生像预期所希望的多肽。Chilkoti说:“他在现场一次性制造出了19种不同的聚合物。在以前,这大概要花几十年的研究时间来制造,但是,他能够在一个星期内完成。”
现在,Chilkoti和Tang正在通过一个简单的网络形式,研制任何人都可以在线使用的新计算程序,从而为合成生物学领域打开了一个新领域。
Tang说:“这一进展的确使合成生物学领域变得更为大众化。以前,你需要有很多的专业知识和耐心去做重复的工作,但是现在,任何人都可以在线订购它们。我们认为,这可能会打破阻止这一领域发展的瓶颈,并希望招募更多的人进入该领域。”
(生物通:王英)
生物通推荐原文摘要:
Combinatorial codon scrambling enables scalable gene synthesis and amplification of repetitive proteins
Abstract: Most genes are synthesized using seamless assembly methods that rely on the polymerase chain reaction1, 2, 3 (PCR). However, PCR of genes encoding repetitive proteins either fails or generates nonspecific products. Motivated by the need to efficiently generate new protein polymers through high-throughput gene synthesis, here we report a codon-scrambling algorithm that enables the PCR-based gene synthesis of repetitive proteins by exploiting the codon redundancy of amino acids and finding the least-repetitive synonymous gene sequence. We also show that the codon-scrambling problem is analogous to the well-known travelling salesman problem4, and obtain an exact solution to it by using De Bruijn graphs5 and a modern mixed integer linear programme solver. As experimental proof of the utility of this approach, we use it to optimize the synthetic genes for 19 repetitive proteins, and show that the gene fragments are amenable to PCR-based gene assembly and recombinant expression.