文/墨茶
编辑/墨
前言囊性纤维形成过程中,跨膜转录调控因子是一类具有调控Ca²⁺浓度的氯离子通道,在调控离子浓度的基础上,通过对氯离子通道的活性进行调控,在维持上皮细胞膜上的钙转运及水化平衡中发挥着关键作用。
CFTR是一类重要的转运蛋白,其功能主要受多个蛋白的调节,受到多个蛋白的控制,涉及到多条信号传导途径。囊性纤维化是一种广泛存在于多种组织中的疾病,其发生与细胞分泌的细胞分泌物质的代谢异常密切相关。
从蛋白层面进行了多种实验,其中最简便的一种,就是从氨基酸层面进行了实验。举例来说,G551D基因的变异在一群有囊状纤维变性的病人中是很普遍的,它的变异导致了 CFTR的一个定位在细胞膜上却不能响应细胞讯息而打开。
尽管已有研究对 CFTR蛋白质变化规律的研究具有借鉴意义,但难以发现可由传统的数理统计推断得到的与 CFTR蛋白质变化规律有关的数据特征。
典型的氨基酸序列并非向量型或标量型,但大部分的数理分析法所采用的资料类型均可归入这两类资料范畴。这就要求把经典的蛋白序列转换为数量级的蛋白序列,并对其进行全面、系统的研究。
目前已有大量的研究工作,通过改变蛋白中的氨基酸的理化特性,如分子量,熔点,旋光度等来替换蛋白中的氨基酸。另外,本课题组基于随机理论,提出了三种从标记蛋白到纯量型蛋白的转化算法。
CFTR基因的基因变异是造成患者预后差异的重要原因,研究其基因变异对患者预后的影响具有重要意义。因此,我们拟在前期工作基础上,利用遗传算法对 CFTR蛋白质进行定量分析,并对其突变位点进行全面的解析。
材料与方法1.数据
从前期研究发现, CFTR基因编码基因编码基因具有185个天然突变,5个缺失,2个插入,178个错义。
2.转化标志性CFTR蛋白质序列为标量数据
蛋白质由20种自然氨基酸构成。尽管这20种氨基酸能够通过氨基酸的物理化学特性进行替代,但替代后的20种氨基酸并不能够表示诸如蛋白质突变、序列长度、蛋白质组成、邻近氨基酸以及氨基酸位置的改变。所以,这种转换方式并不适合用于变化规律的研究。