近几十年来,随着全基因组测序技术的不断成熟,我们在各种细菌和古细菌(archaea)中也陆续发现了很多成簇的、规律间隔的短回文重复序列(clustered regularly interspaced short palindromic repeat sequences,即CRISPR序列,这就是二十多年前日本科学家发现的那个序列)和CRISPR相关基因(CRISPR-associated genes,Cas gene)。研究发现,这些CRISPR序列与很多病毒或者质粒的DNA序列是互补的,说明这套CRISPR–Cas系统很有可能是生物体抵御病毒等外来入侵者的一套特异性防御机制,就好像是另外一套适应性免疫反应系统(adaptive immune system)。
目录
1CRISPR RNA
2Cas 家族
3作用机制
4小结
1CRISPR RNA编辑
[1-2]
Clustered Regularly Interspaced Short Palindromic Repeats RNA,是最近几年才发现的原核生物中的调控RNA,第一次是在1987年在大肠杆菌中有报道,到2000年时,有人证实了,目前为止,已有40%已测序的细菌和90%已测序的古细菌中有报道。CRISPR含有一个与噬菌体和质粒同源的短的重复序列,通过对外来同源的DNA作用对噬菌体有抗性,影响质粒的连接,是原核生物的免疫系统一部分。 CRISPR sequences是一个高度多变的DNA序列,常包含一个550bp的leader 序列和一系列重复单位(repeat-spacer units)。重复序列长度在24-48bp,他们通常会形成二重对称,因此会形成如发夹结构的二级结构,但不是回文结构,重复次数最高可达250 次。重复序列之间被26~72 bp 间隔序列(spacer)隔开, 间隔序列长度与细菌种类和CRISPR 位点有关。在一个原核细胞基因组中通常存在1 至几个CRISPR 位点, 例如在Methanocaldococcus jannaschii 的染色体上已鉴定出18 个不同的CRISPR 位点, 差不多占整个染色体的1%。CRISPR 位点通常定位在原核细胞染色体上, 个别出现在质粒中。CRISPR 的间隔序列与噬菌体或质粒序列存在有同源性, 甚至有一些间隔序列与噬菌体基因组序列同源性为100%, 这表明间隔序列来源于噬菌体基因组。
2Cas 家族编辑
在CRISPR 位点附近, 存在一系列CRISPR相关基因(CRISPR-associated, Cas),在许多原核生物中都有发现。cas 基因根据其保守程度可分为核心cas 基因, 亚型特异性cas 基因和 RAMP (repeat -associated mysterious proteins)组件基因。在CRISPR 位点的第一个重复序列的上游定位有CRISPR 前导序列(leader sequence), 其功能作为启动子。当CRISPR转录后,Cas 蛋白加工CRISPR RNA成一个沉默RNA,这个沉默RNA就会对外来同源的DNA起到作用。CRISPR-Cas 系统的生物学功能开始是通过计算机分析细菌和古细菌的基因组序列被发现的, 之后得到了实验证实。
3作用机制编辑
目前为止, 虽然对CRISPR-Cas 系统的详细作用机制尚未得到完全阐明, 但已基本明确了它的作用机制的整个过程。CRISPR-Cas 系统的作用机制大体可分为3 个不同阶段,如图:
在噬菌体侵入的起始阶段,Cas 蛋白复合物靶向并裂解噬菌体基因组中短的原型间隔序列(proto-spacer),这些原型间隔序列剪下来整合到宿主基因组中的CRISPR 位点的5′端。然后这些短的掺入的间隔序列被转录成crRNAs(CRISPR RNAs), crRNAs 中除含有间隔序列转录物外, 还含有间隔序列两侧部分重复序列的转录产物。最后阶段是靶向和干扰侵入的噬菌体DNA 序列, 这个过程仍需Cas 蛋白复合物参与。当宿主再被噬菌体感染时, crRNAs 作为模板靶向噬菌体的原型间隔序列,靶向的DNA 序列中是否含有CRISPR 的部分重复序列, 如果含有这部分序列, crRNAs 与之通过碱基配对结合后被干扰降解。
4小结编辑
CRISPR-Cas 系统作为原核细胞的适应性免疫系统, 不但具有真核细胞的特异性和记忆性,而且还具有原核细胞特有的可遗传性,从CRISPR 系统在细菌中分布的广泛性和多样性可以看出, CRISPR 位点是细菌在漫长的进化中不断形成的, 也说明CRISPR 免疫防御系统在原核细胞中可能是最原始的免疫系统之一。CRISPR 位点除了它的防御功能外, 在一些细菌中似乎具有其它功能。如, 在鉴定的两个相关的Thermotoga 菌的基因组中, 有许多大的转位发生在CRISPR位点。