|
1.4 蛋白质结构与功能关系的研究
上一节介绍了生物信息学与人类基因组计划的关系,说明生物信息学在DNA水平上、在基因组信息分析中的重要作用。虽然目前生物信息学的核心是基因组信息学,但研究蛋白质序列、蛋白质结构以及蛋白质的功能也是生物信息学的一个重要方面。基因是重要的生命信息,但是,基因需要通过表达将信息转移到蛋白质上,蛋白质是生命活动的主要承担者。人类基因组计划勾画出人体的蓝图,然而,全面了解复杂的人体,还需要进一步深入认识基因组所产生的全部蛋白质和RNA。这是蛋白组学研究的推动力。
蛋白质组 (Proteome)是指由基因组编码的全部蛋白质。从这个定义看,蛋白质组内蛋白质的数目似乎应该等于基因组内对蛋白质进行编码的基因数目。但在生物体内这样的蛋白质组是不存在的,就基因表达而言,在一个细胞中,并不是所有基因都同时表达的,因而,一个细胞的蛋白质组中蛋白质的数目少于基因组中基因的数目。但是,从基因可变剪切和蛋白质修饰的角度看,蛋白质的数目又远远多于基因组中基因的数目。基因组基本上是固定不变的,而蛋白质组是动态的,具有时空多变性和可调节性,能反映基因的表达时间、表达量,以及蛋白质翻译后的加工修饰和亚细胞分布等。在特定时间、特定环境和实验条件下,基因组活跃表达的蛋白质为功能蛋白质组 (Functional Proteome) ,功能蛋白质组只是总蛋白质组的一部分。蛋白质组和功能蛋白质组是生命科学新的研究内容。蛋白质组学(Proteomics)是研究细胞内所有蛋白质及其动态变化规律的科学,旨在阐明生物体全部蛋白质的表达模式及功能模式,其内容包括鉴定蛋白质的表达、存在方式 (修饰形式 )、结构、功能和相互作用等。从蛋白质组的定义上就可以清楚地看出,蛋白质组学与传统的蛋白质研究不同之处在于,它的研究是在生物体或其细胞的整体蛋白质水平上进行的,它从一个机体或一个细胞的蛋白质整体活动的角度来揭示和阐明生命活动的基本规律。
人类基因组计划的不断推进,其结果不仅导致DNA序列数据的迅速增长、已知基因数的迅速增加,也导致蛋白质序列数据的迅速增长,因而,对蛋白质数据进行处理、进行信息学分析和研究也就顺理成章。利用生物信息学,可以对蛋白质进行同源分析,研究蛋白质之间的进化关系,研究蛋白质的家族关系。当然,对于蛋白质,我们更关心的是蛋白质序列、蛋白质结构和蛋白质功能之间的关系。在蛋白质研究中,一个关键的问题是蛋白质的空间结构。这是因为,我们最终所关注的是蛋白质的功能,而蛋白质的功能又是由蛋白质的构象或空间结构所决定的。然而,我们目前通过实验所得到的蛋白质结构还比较少,因此,需要通过理论计算或统计预测方法来得到蛋白质的结构,为进一步研究蛋白质的功能和进行分子设计提供依据。生物信息学在蛋白组学研究中的最主要任务是产生、分析和预测蛋白质的结构,并将结构知识应用于生物学、医学、药学等生命科学领域。
蛋白质空间结构预测是一个重要的问题,它成为近年来全世界生物学家关注的焦点。从20世纪 50年代第一个蛋白质——肌球蛋白的空间结构被测定至今已有近50年的历史,但总计被测定结构的蛋白质结构只有2万多个,实验测定蛋白质的结构非常困难。因此,目前要想用实验的方法测定所有蛋白质的空间结构几乎是不可能的事情。解决这一问题的有效途径似乎只有从理论上发展预测蛋白质结构的新方法。这些方法的基本思想是将基于经验和知识的方法与计算化学、统计物理学、信息学的方法结合起来,从理论上预测蛋白质的空间结构。一旦这些方法取得成功,蛋白质折叠这一分子生物学难题将有望获得解决,同时也为分子生物学研究提供新的思路。蛋白质的序列与蛋白质的结构存在着一种对应的关系,这是目前蛋白质结构预测的一种前提性假设。在该假设下,我们可以研究如何根据蛋白质序列来预测蛋白质的结构。蛋白质的空间结构比蛋白质序列更保守,因此可以认为同源的蛋白质具有相似的空间结构。在进行蛋白质结构预测时,首先寻找待定结构蛋白质的同源物,并且要求知道所找到的同源蛋白质的结构。这样,利用同源相似性,推测未知蛋白质的结构。与结构预测相反的一个问题是,如果要到达某种特定的空间结构,那么什么样的蛋白质能够具有这样的结构呢?换句话说,什么样的氨基酸序列能够折叠成特定的蛋白质结构呢?
蛋白质结构是合理药物分子设计的基础。许多药物分子作用的靶是蛋白质或者酶,其活性部位或结合部位是药物作用的目标。这些部位具有特定的空间形状,只能和特定的分子相结合。在设计新的药物分子时,往往要考虑使得所设计的药物小分子结构与靶的活性部位互补,这样才能使得药物分子与靶结合,从而发挥药效。这就要求知道相应蛋白质活性部位的空间结构。

基于生物信息学的新药设计
蛋白质结构也是蛋白质工程的基础。所谓蛋白质工程是指人们在深入了解蛋白质空间结构以及结构和功能之间的关系,并且在掌握基因操作技术的基础上,设计和改造蛋白质,从而改善蛋白质的物理和化学性质,例如提高蛋白质的热稳定性,提高酶的专一性,使之更好地为人类所用。
生物信息学除了研究蛋白质结构及功能关系之外,还可以研究蛋白质的进化问题,研究不同蛋白质之间的进化关系。分析和比较蛋白质序列是开展进化分析或者系统发生分析的基础,通过序列比较,计算序列之间的“进化距离”,判别两个蛋白质究竟是“远亲”还是“近邻”,进而绘制一组蛋白质的家族图谱。但是蛋白质序列比较比DNA序列比较更加复杂,其中一个原因是,DNA序列仅由4种碱基组成,而蛋白质序列则由20种氨基酸所组成。蛋白质序列不仅组成元素多,而且组成元素之间的关系复杂,例如,各个氨基酸之间的关系可以是理化性质相似的,也可以是对应密码子相邻的。因此,对蛋白质序列相似关系的评价更加复杂。
现在生物信息学也可以用于研究蛋白质的性质,如蛋白质的亲水性和疏水性,判断蛋白质翻译后的修饰位点,确定信号肽位置,进行三维蛋白质分子模拟等。生物信息学的发展将极大地推动蛋白质结构和功能研究的发展,推动新药设计的发展。
共8页: 上一页 [1] [2] [3] 4 [5] [6] [7] [8] 下一页
上一篇:基因表达参考文献 下一篇:生物信息学的生物学基础
|