|
综合数据
转录组学和蛋白组学分析要想整合成功,需要有效和精确的相互参考。研究人员需要灵活的定义自己的基因图谱,但也可能需要选择采用预定义的针对蛋白质的目标图,当新的基因组、转录组和蛋白组序列出现,研究人员需要及时注册更新,并且删除错误的信息。
高通量转录组学和蛋白组学分析的数据量要求根据用户定义的标准来过滤数据,例如测量性质。在转录组学分析之后进行定量的蛋白组学实验,废弃不可靠的定量测量将会减少假性前导物的量,尤其是在蛋白组学水平。误差模型如那些建立在像RosettaResolver或RosettaElucidator系统的产物,最适合这种处理。实际上,过滤不是“万能方法”,还是应该根据平台(如微阵列或质谱仪)和实验设计进行具体的操作。
可是,有时候会出现这种情况:应用显著性概率P值阈值作为转录组学或蛋白组学数据性质典型标准,真正没有改变的基因表达数据将被忽略掉。如果基因表达只在一个水平上有变化,作为转录后调节的目标就可能会增加假阴性率。从这个角度看,对过滤的背景进行指导对研究人员是有帮助的。
蛋白质数据面临的另一个问题是,不能区别出蛋白质剪接变体,或是无法鉴定出肽序列。只有获得新的测序信息,才可能解决这些问题,预定义分析过程或其他“一次点击”方法能让科学家对已有的MS/MS数据进行重分析(如,SEQUEST),并且能将任何有关定量蛋白质更新信息(包括新添加的、删除或改动)告知研究人员。
接下来,在转录组学和蛋白组学水平上对数据进行处理,需要对“转录物和蛋白质注解和定量测量的数据”进行比较分析。典型的微阵列分析有一个有限的靶标集――昂飞、安捷伦和美国应用生物系统公司都将他们的靶标与对应的RefSeq序列标识符直接进行相互参照。很多公司都提供预订服务,例如Inpharmatica公司的Blu-Chip作为一种商业化解决方案,在最新的序列信息中有规则的查找靶序列,对蛋白质对应的基因靶标进行定位作图。
一个使用更广泛的工具是EBI的国际蛋白索引(IPI),该索引是蛋白组学分析的理想工具,可以提供广泛的基因组(具有最小冗余)范围。然而,EBI为其他的数据库(如RefSeq和Swiss-Prot)提供的相互参照通常是不完整的,在建立转录物-蛋白质对的时候会产生数据流失。目前,提出了一个两次流程相互参照程序,例如,根据公开的数据库,在第一流程中无法获得从蛋白质到基因的相互参照的高质量MS/MS谱,就可以在最新的基因组序列信息中进行搜索,去获取蛋白质序列数据库中没有的那部分拼接变体结果。
根据电荷态预测的一致性,可以用算法去评定MS/MS谱,离子流量和信噪比可能会有助于数据外存储器的自动选择,以便在基因组数据库中进行BLAST搜索。在两个流程之间也能进行肽段的翻译后修饰研究。人们是根据峰和同位素膜性质来评定高质量的MS谱,但是如果得到的MS/MS谱不好,就有可能会被认为是中性脱失,例如,磷酸盐、甘露糖或其他的翻译后改变,用MS3碎片可以选择这些峰去产生有用的肽裂解谱。
分析过程中,应该随时对mRNA和蛋白质半衰期的差异进行比较,如随着疗程的进展,在转录物和蛋白水平捕获表达中出现的暂时变化。动态分析工具能随时监测mRNA和蛋白水平中的动态变化,根据相互轨迹的良好适宜性,能对两者之间的一致性进行评估。此外,当蛋白质表达软件分析系统如RosettaElucidator系统能对定向的MS/MS信号肽峰进行挑选,就能监测到一列峰的MS。
即使当相互参照无法与mRNA-蛋白质对相匹配时,功能分析也能获得额外的信息。转录物和蛋白质呈现出的差别表达特点,通过将具有GeneOntology(GO)分析工具的RosettaResolver和Elucidator系统直接整合,可以把二者区别开。即使数据对两个水平上的一些组成基因无效,GO分析也能揭示出转录物或蛋白质共同以及各自特有的生物学功能。
表达分析具有揭示新基因的能力。更重要的是,在转录物和蛋白质水平上的整合表达分析,能对整体的基因-基因相互作用网进行描述,提供单个基因活性中的功能内容,正如传统技术揭示的那样,这些内容会影响到生物学功能。最后,表达分析和分子生物学研究都有助于系统的了解宿主应对环境挑战、药物质量或疾病状态的反应。为了这个目标,新的分析软件工具将帮助研究者储存在蛋白组学和转录组学中新出现的高通量技术的全部力量。
表1:转录组学和蛋白组学的整合
参照系阵列平台质谱平台研究系统mRNA-
蛋白质对相关
5cDNA-
Cy3/Cy52DE-SYPRO
Ruby人THP-1细胞8低
6寡核苷酸-
Cy3/Cy52D-DIGE人NB4细胞6低
7cDNA-
Cy3/Cy52DE-
Comassie人主要的VSMC细胞5动态相似,但是不同的变化交叉
8cDNA-
Cy3/Cy5LC-MS-ICAT鼠细胞系150
144R=0.59
R=0.54
9cDNA-
Cy3/Cy5LC-MS-ICAT鼠皮质二乙基溴乙酰胺细胞4848%一致性
10cDNA-Cy3/Cy5LC-MS-ICAT酵母166变化不定
11寡核苷酸LC-MS-15N/14N酵母678R=0.45
(译自《Genomics&Proteomics》)
共2页: 上一页 [1] 2 下一页
上一篇:提取土壤总DNA的几种方法 下一篇:蛋白的生物活性测定方法
|