DNA双螺旋结构
生物学DNA分子真是把“大道至简”的理念发挥到了极致:跟二进制组成的计算机信息世界有异曲同工的妙处。物质选择了这样以简单基础的聚合方式成就了整个生物界,从此再无其他方式能介入其中,真是太神奇了。
简单之后就是复杂了,1个碱基对的长度是0.34*10^-9米, 人的每个细胞中一共有约60亿个碱基对,每个细胞中全部碱基对的长度约2.04米。
不同生物的DNA长度差别很大,而且不是体型大,DNA长度就长,下面是不同物种的DNA长度图(C值):
不是生物约大,NDA就越长
DNA链条中有很多非基因编码的片段,但是也不是没有用,他可以概率性地保护基因片段的安全,基因片段占的越短,DNA越稳定,物种越不容易发生变异。
从基因数量来看,复杂生物的基因数量要多一些,下面是一些生物的基因数量表:
稻子的基因组好庞大
蛋白质编码基因:人类的基因数量比某些较为原始的生物更少,是在人类细胞中基因存在“可变剪切”性,通过把同一段基因翻译成的mRNA成不同的片段再重新组合,可以生成很多不同的蛋白质。长期的进化,使得基因的编码效率更高了。
除了蛋白质编码基因之外,人类的基因组还包含了数千个RNA基因,其中包括:转录rRNA的基因、转运RNA(tRNA)、核糖体RNA(rRNA)、信使RNA(mRNA)的基因。
除此之外,人类基因组还含有许多不同的调控序列,并以此来控制基因表现。这些序列是典型的短序列,会出现在靠近基因的位置。
蛋白质编码序列(也就是外显子)在人类基因组中少于1.5%。在基因与调控序列之外,有许多功能未知的广大区域。这些区域在人类基因组中约占有97%,其中许多是属于重复序列(repeated sequence)、转座子(transposon)与假基因(pseudogene)。除此之外,还有大量序列不属于上述的已知分类。
另外,每个人身上的基因时有差异的,包括:1.DNA中的个别碱基变换(单核苷酸多态性);2.一些小型的重复序列,它们拥有的基因座与基因长度,在不同的个体之间有很大的变异性。 配子细胞(精子或卵子)中大多数的基因组突变,可能会造成胚胎不正常发育(有的造成自然流产,所以不是什么胎都值得保),而人类的一些疾病也与大尺度的基因组异常有关。