大家都知道,基因序列中存在内含子、外显子等序列。这里咱们就来一一介绍基因中的各种功能序列,包括它们的相互位置关系。
1.转录区(transcribed region)是编码初级转录产物核苷酸序列的DNA序列,即RNA聚合酶转录的全部DNA序列,始于转录起始位点,终于终止子,占人类基因组序列的90%以上,其中信使RNA前体转录区占人类基因组序列的30%。转录区与含调控元件的其他序列组成转录单位(transcription unit)。
2.编码序列(coding sequence)是基因组中编码成熟信使RNA、转运RNA、核糖体RNA序列的DNA序列,例如外显子。其中,成熟信使RNA的编码序列称为编码DNA,占人类基因组的1.5%(其余98.5%称为非编码DNA)。人类基因组序列中只有不到2%是信使RNA、转运RNA、核糖体RNA编码序列。
3.非编码序列(noncoding sequence)①基因序列中除编码序列之外的所有序列,例如内含子、增强子。②基因组序列中除基因序列之外的所有序列。人类基因组序列中98%以上都是非编码序列(ENCODE计划研究表明人类基因组序列约80%都是有功能的,且大部分序列是被转录的,虽然转录效率很低)。
4.外显子(exon)是构成断裂基因的两种序列之一,是指在RNA前体剪接时被保留的序列,因而是转录区、RNA前体、成熟RNA中都存在的序列,属于编码序列,在转录区及RNA前体中与内含子交替连接。
哺乳动物50%基因所含的外显子数超过10个(人类基因所含的外显子数为1~179个,平均为7~9个)。外显子长度较短,平均长度为145~150nt(50~10000nt),仅够编码一个结构域(约50AA。AA为氨基酸,肽链长度单位)。人类基因外显子序列的长度占转录区的5%~10%,占基因组序列的1%~1.5%。
5.内含子(intron) 又称间插序列(intervening sequence,IVS),是构成断裂基因的两种序列之一,是指在RNA前体剪接时被切除的序列及其对应的DNA序列,因而只存在于转录区和RNA前体中,属于非编码序列。研究发现假基因往往缺少正常的内含子,提示内含子可能参与基因表达调控。
外显子序列相对保守,而内含子序列变化较大,且其长度与生物进化程度呈正相关,是决定基因长度的主要因素。人类基因组中内含子序列的长度占转录区的90%~95%,占基因组序列的24%~25.9%,每个内含子平均长度约3365nt(50~10000nt,有的可达800000nt)。
6.启动子(promoter)是指基因序列中能被RNA聚合酶识别、结合,从而形成转录起始复合物并启动转录的DNA序列,大多数位于基因(或操纵子)转录区的上游,具有方向性,属于调控元件。
7.转录起始位点(transcription start site,TSS)是转录区的第一个核苷酸,在指导RNA合成时最先被转录)。Suzuki等分析了人类基因组276种基因转录的5880种mRNA的转录起始位点:A(47%)、G(28%)、C(14%)、T(12%)。
8.终止子(terminator)全称转录终止子,是位于转录区下游的一段DNA序列,是转录的终止信号,其转录产物可通过形成发夹结构或其他二级结构使转录终止。