什么是基因合成
基因合成是依照某一蛋白质的基因序列,设计合成相互重叠的单链寡核苷酸,再通过重叠延伸PCR法拼接出全长,基因合成无需模板,是获取基因的手段之一以提高在异源宿主的表达量行全基因合成,目前该技术主要应用在基因的异源表达上,对基因密码子优化后进。
此外,基因合成技术还用于合成一些不易获取模板的基因或者自然界不存在的新基因等。基因合成技术可以按照人们的意愿设计且灵活地合成,正好符合了当代生物学发展的潮流,将会在越来越多的领域得到应用,并且发挥巨大的作用。
基因合成的方法主要有组装PCR重叠延伸PCR、TBIO法、PTDS法等。困扰全基因合成技术的问题主要有2个:①合成基因中碱基错误率高。②合成成本高。
在基因合成前,为使基因在不同生物表达体系中都能得到良好表达,研究人员通常会对基因进行密码子优化。遗传密码有64种,但是绝大多数生物倾向于利用这些���码子中的一部分,那些被最频繁利用的称为最佳密码子,那些不被经常利用的称为稀有或利用率低的密码子。
实际上用做蛋白表达或生产的每种生物(包括大肠杆菌,酵母,哺乳动物细胞,植物细胞和昆虫细胞)都表现出某种程度的密码子偏爱性,因此,重组蛋白的表达可能受密码子利用的影响(尤其在异源表达系统中)。
在不改变其编码蛋白的情况下,对一个蛋白的编码基因进行改变,去除稀有密码子,合理优化其mRNA二级结构,GC含量等的过程叫密码子优化。密码子优化的原理即根据将要使用的表达系统的密码子偏爱性,针对目标蛋白序列中的每一个氨基酸选择不同的密码子进行全序列的组合,找出其中*的一条。
1、引物合成
研究人员根据自己的意愿确定合成的基因序列后,由于没有模板,首先需根据待合成的双链DNA设计引物、合成引物。引物,又名引子,是一小段单链DNA或RNA,作为DNA复制的起始点,在核酸合成反应时,作为每个多核苷酸链进行延伸的出发点而起作用的多核苷酸链。
在PCR(聚合酶链式反应)技术中,已知一段目的基因核苷酸序列,根据这一序列合成引物,利用PCR扩增技术,目的基因DNA受热变性后解链为单链,引物与单链相应互补序列结合,然后在DNA聚合酶作用下进行延伸,如此重复循环,延伸后得到的产物同样可以和引物结合。
简单地说,引物即是短的单链DNA或短的RNA链,序列长度一般为15~90nt(nt为引物碱基单位,有些也用nt或bp标识),一般不超过120nt。目前引物合成基本采用固相亚磷酰胺三酯法。亚磷酰胺三酯法合成DNA片段,具有高效、快速的偶联以及起始反应物比较稳定的特点。亚磷酰胺三酯法是将DNA偶联在固相载体上完成DNA链的合成的,引物合成的方向依据既定引物序列由3'端向5'端延伸,相邻的核苷酸通过3'→5'磷酸二酯键连接。
2、引物互为模板PCR扩增
引物合成后,引物之间互为模板进行PCR扩增。PCR技术的基本原理类似于DNA的天然复制过程,其特异性依赖于与靶序列两端互补的寡核苷酸引物。
PCR由变性-退火-延伸三个基本反应步骤构成:
①模板DNA的变性:模板DNA经加热至93℃左右一定时间后,使模板DNA双链或经PCR扩增形成的双链DNA解离,使之成为单链,以便它与引物结合,为下轮反应作准备;
②模板DNA与引物的退火(复性):模板DNA经加热变性成单链后,温度降至55℃左右,引物与模板DNA单链的互补序列配对结合;
③引物的延伸:DNA模板-引物结合物在TaqDNA聚合酶的作用下,以dNTP为反应原料,靶序列为模板,按碱基配对与半保留复制原理,合成一条新的与模板DNA链互补的半保留复制链。
重复循环变性-退火-延伸三过程,就可获得更多的“半保留复制链”,而且这种新链又可成为下次循环的模板。每完成一个循环需2~4分钟,2~3小时就能将待扩目的基因扩增放大几百万倍。
3、连接转化、菌检送测
通过PCR反应,可扩增出我们需要的双链DNA。但PCR产物稳定性较低,我们需将连接到质粒上,转化进感受态中,涂平板过夜培养。第二天早上就可以从平板中挑选阳性克隆,挑到的克隆需要再次使用菌落PCR验证是否有全长的基因插入,使用首尾引物进行PCR,如果有产物,说明有目的基因。将验证过的克隆转化进入试管培养摇菌,之后,抽提质粒,纯化送去进行测序。
4、一代测序
目前,我们采用的是一代测序,也叫sanger测序。Sanger法测序利用一种DNA聚合酶来延伸结合在待定序列模板上的引物,直到掺入一种链终止核苷酸为止。每一次序列测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸(dNTP),并混入*的一种不同的双脱氧核苷三磷酸(ddNTP)。
由于ddNTP缺乏延伸所需要的3-OH基团,使延长的寡聚核苷酸选择性地在G、A、T或C处终止。终止点由反应中相应的双脱氧而定。每一种dNTPs和ddNTPs的相对浓度可以调整,使反应得到一组长几百至几千碱基的链终止产物。
它们具有共同的起始点,但终止在不同的核苷酸上,可通过高分辨率变性凝胶电泳分离大小不同的片段,凝胶处理后可用X-光胶片放射自显影或非同位素标记进行检测。
5、QC验证
将测序结果与目标基因进行比对,同时进行QC酶切验证,如果测序结果与酶切验证结果均正确,就完成目的基因的合成了。按照上述步骤,顺利的情况下5天时间就能合成出一段800bp左右的基因序列。
目前,基因合成周期短,同时可以保证序列的100%正确无误,具有很大的灵活性,可以对基因的酶切位点和基因序列进行修改,方便下游的克隆和实验;研究人员根据自己的意愿设计得到自然界中很难获得甚至不存在的基因;基因合成的基因可以进行密码子优化,使基因在各种生物表达体系中都能得到良好表达。
这些优点使得基因合成在生物领域有着广泛应用,比如克隆人鼠抗体或重组抗体、合成不同的基因突变株、SNPS或其他突变株、设计合成DNA疫苗、大量合成用于微芯片的cDNA等。基因合成技术的发展使生物领域又上了一个新台阶。
基因合成产业
美国基因合成产业发达,有赖于发达的生物产业,政府与企业在基因业务上投入比较大,而国内大批量投入的科研产业少,基因合成市场有限,客户主要是科研单位。未来中国的基因合成产业,很大程度上受到国家对生物产业的政策引导的影响。
国外分析机构的数据显示,2014年全球包括工业级和科研级在内的合成基因市场规模为20亿美元,其中中国1.2亿美元,仅占6%。这个小数据表明,国内生物产业自己研发的东西太少,大部分国内生物制药企业,还是持续依靠复制国外技术,甚至等技术过期后直接拿来用,这样并不需要合成基因。
因为合成基因只有在前期研发的时候才有较大的应用空间,如果研发投入少,基因合成出来没有消耗的市场,投入相应就会小很多。国内生物制药企业长期只是模仿,路会越走越窄,发展到一定程度就会遇到很大的瓶颈。
从另一方面看,各国的生物产业都受到一定的限制,这是由行业特征决定的:生物产业是一个长期投入、高投入、成功率不高的产业,不像其他行业那样能更快地产业化。
经过十几年的发展,整个基因合成行业已经很成熟,然而,也引发了一系列行业问题。由于进入门槛低、竞争无序,国内企业不得不凭借国内人力成本低的优势,趋向到国外接单、国内合成的业务。
基因合成入行门槛不高,一些小的公司买一台仪器,三四个人就可以从事这项工作,一个人去跑市场,攒够订单后就能开机。
基因合成行业拼的主要是仪器的通量。企业开机一次合成低于1000条BP是亏钱的,大规模、大通量才可以降低成本。
挤入这个行业者众多,但基因合成技术还处于1.0版本,合成能力有限、合成周期较长、通量不高,因此,成本高。合成价格对于需求方而言仍然昂贵,也是国内基因合成产业发展缓慢的主因之一。
电话
微信扫一扫