Ensemble ID
Ensembl是另外一个记录基因信息的数据库。就笔者而言查询基因信息更多使用的gene数据库(其实更多的还是genecards),这个数据库使用的较少。但是这个数据库对于基因的注释十分的详细且权威,所以也就形成了很多个基因不同情况下的ID了。大致的我们能看到的和Ensembl有关的ID的话就有以下几种。
关于Ensembl ID,不管是什么类型的,其ID号的前三个开头都是以ENS开头的。剩下的可以再看第四位:
G代表是Gene。是这个基因的的唯一编码,类似于Gene数据库里面的数字
T代表Transcript。是数据库对于不同转录本的ID号。这个类似于上面gene数据库当中的NM编号开头的ID。
P代表protein。是数据库对于不同蛋白的ID号。这个类似于上面gene数据库的NP编号开头的ID。
另外对于不同的ID,由于其基因信息也会经常所以为了更加详细的区分,Ensembl数据库就又在各自的ID号后面又加了一个.ID来代表不同的版本。所以就有了ENSGXXXX.1这样的编号。
综上,Ensembl数据库的ID号可以用以下这个图来代表。
Uniprot ID