真核生物的基因组复杂且DNA含量丰富,与原核生物相比,其基因组具有显著差异。为了在有限的基因组内编码必要蛋白,噬菌体进化出了一种策略,即“重叠基因”,使得每个碱基都能参与编码,从而增加遗传信息的密度。然而,真核生物基因组的情况则截然相反,DNA极为充裕,无需“重叠基因”,基因组中包含了多种非编码序列,如重复序列、间隔序列(间隔区,包括转录间隔区TS和非转录间隔区NTS)和间插序列(内含子)。尽管这些非编码序列看似无功能,但可能隐藏着未被完全理解的作用,如重复序列。
在遗传学的视角中,能够编码蛋白质的基因通常被称为结构基因。真核生物的结构基因表现出断裂的特性。一个断裂基因包含多个编码部分,称为外显子,这些区域负责蛋白质的合成。外显子之间嵌套着不编码的间隔序列,即内含子。每个断裂基因的首尾两端还有非编码的侧翼序列,这些区域通常附带有调控序列,对基因表达的调控起着关键作用。
扩展资料
真核生物结构基因,由若干个编码区和非编码区互相间隔开但又连续镶嵌而成,去除非编码区再连接后,可翻译出由连续氨基酸组成的完整蛋白质,这些基因称为断裂基因(splite gene)。