以表型组为重心的肿瘤多组学、生物标志物及精准医学解析

(整期优先)网络出版时间:2023-04-19
/ 2

以表型组为重心的肿瘤多组学、生物标志物及精准医学解析

詹显全

山东第一医科大学医学科技创新中心  山东 济南  250117

导读:人们的普遍心里都是谈癌色变,癌症夺去了很多人宝贵的生命,及早的发现癌症,是治疗癌症疾病的前提和关键环节,那么对于肿瘤蛋白质组与蛋白质存在形式,肿瘤多组组学与生物标志物,以及肿瘤预测预防个体化医学与精准医学分子靶标等等课题的研究,在肿瘤的防、诊、治领域就显得尤为重要。医学研究表明,蛋白质组和代谢组是表型组的重要元素,他们的贡献是同等重要,是基因组所不能替代的是不能绕过去的。其中蛋白质组的研究又应以翻译后修饰和蛋白质存在形式作为今后的研究方向。应从以基因组为重心的研究和实践转向以表型组为重心的多组学研究,寻找有效的生物标志物,解决肿瘤的精准预测、预防、诊断、治疗和预后评估。

1.肿瘤蛋白质组与蛋白质存在形式

蛋白质翻译后修饰是蛋白质组学领域极其重要而又研究最薄弱的方面;其种类繁多,每种翻译后修饰的性质特点不同,研究方法也不相同。詹显全教授课题组研究了硝基化、磷酸化、泛素化、乙酰化等修饰。例如,蛋白质硝基化是几百种翻译后修饰中的一种,硝基化是氧化应激的产物参与人体很多疾病如肿瘤的病理生理过程,这个修饰在体内含量很低,但其生物学效应很明显,经常发生在蛋白质的重要功能结构域,影响蛋白质功能。

   蛋白质组信息学技术主要是用来构建蛋白质相互作用网络的相关技术。蛋白质组的分离技术和质谱技术的不同联合就形成了各种类型的蛋白质组学分析技术:如2DE-MS和2DLC-MS。2DE-MS又有2DE-MALDI-PMF和2DE-ESI-LC-MS/MS,该技术在蛋白质组学研究的头10-15 年是其主要技术,然而常规概念认为2DE的通量不高,即一个2D胶点中一般仅含有1~2个蛋白质,通常一次实验其通量仅能鉴定几十到一千个蛋白质,这样其在蛋白质组学中的地位逐渐被淡化。

2DLC-MS主要有基于iTRAQ or TMT标记的SCX-LC-MS/MS and label-free LC-LC-MS/MS,这就是人们通常说的“Bottom-up”蛋白质组学,该技术在最近10~15 年在蛋白质组学中起着核心技术的作用,因为其通量明显增加,一次实验其通量可达到几千到一万的蛋白质能被鉴定,但该法鉴定的结果是一堆的蛋白质(protein group), 实质上鉴定的是编码蛋白质的基因,而并没有鉴定到真正意义上的蛋白质,即蛋白质存在形式。蛋白质存在形式是蛋白质组的基本单元。        

近年来,詹显全教授的工作完全更新了2DE-MS的传统概念,他们发现在分离复杂蛋白质组时,每个2DE胶点可鉴定得到几十个至几百个蛋白质存在形式,一次2DE-MS分析可鉴定几十万至百万的蛋白质存在形式,是鉴定人类蛋白质存在形式的超高通量技术平台。

人类基因大约2万个,人类转录本至少10万个,每个转录本指导核糖体按三联密码子决定一个氨基酸残基来合成氨基酸序列,刚合成出来的蛋白质氨基酸序列是没有功能的,它必须到达其指定的位置如胞内、胞外,和不同的亚细胞器等,形成特定的三位空间结构,并与其周围的相关分子相互作用,形成一个复合物才能发挥其功能作用。从核糖体刚合成出来到其指定的位置过程中有很多的蛋白质翻译后修饰(PTMs:据估计人体有400~600 种PTMs)。我们最近对蛋白质存在形式的概念给出了最新最完整的定义:蛋白质的氨基酸序列+翻译后修饰+空间构型+辅助因子+结合伴侣分子+空间位置+特定的功能。而蛋白质的概念被定义为:由同一个基因编码的所有蛋白质存在形式的集合体。这样,人类蛋白质组中的蛋白质存在形式至少有100万或甚至达10亿。蛋白质存在形式研究能注释生物大分子的精细变化,揭示其精准的功能作用,深度阐述肿瘤的精准分子机制、发现有效的治疗靶点和可靠的生物标志物。

  2.肿瘤多组学与生物标志物

我们认为多组学中的不同组学对肿瘤预测预防个体化医学和精准医学(PPPM/PM)的贡献不是对等的,即个性化的表型组是基因组通向PPPM/PM应用实践的桥梁,而蛋白质组和代谢组是表型组中两重要成分。蛋白质组的内涵包括蛋白质的拷贝数变化、剪切变化、翻译后修饰、转位、再分布、空间构型、与周围分子相互作用、及信号通路网络问题。代谢组的内涵涉及到体内所有物质(包括糖、脂、蛋白质、核酸)的代谢产物及其代谢网络问题。要真正实现PPPM和PM,蛋白质组和代谢组的贡献是基因组所不能替代的是不能绕过去的。

人们应从以基因组为重心的研究和实践转向以表型组为重心的研究和实践。其中蛋白质组的研究又应以翻译后修饰和蛋白质存在形式(Proteoforms)作为今后的研究方向。蛋白质存在形式的研究必将影响着整个生命科学和医学科学。从临床转化研究来看,基于多组学的整合生物标志物是发展方向。对于这里的生物标志物,我们将其分为两类:一类是解决疾病分子机制和药物靶点的生物标志物,这类生物标志物一定要有因果关系;一类是解决预测、诊断、预后评估的生物标志物,这类标志物不一定要求有因果关系,但必要有量的变化。

    生物标志物(Biomarker)是指“一种可客观检测和评价的特性,可作为正常生物学过程、病理过程或治疗干预药理学反应的指示因子”,在肿瘤学领域,生物标志物也一直是近年来的研究热点。在研究人员的不断努力、探求更好更合适的方法来治疗患者的过程中,他们发现,基于多组学的肿瘤生物标志物(Biomarker)将有可能改变肿瘤诊疗中这种不尽如人意的现状。这将改善罹患常见恶性肿瘤的患者的生存率,尤其是那些直到晚期才被诊断出患有癌症的患者的生存率,改变目前肿瘤诊治仍主要采取“无差别对待”的方式,即不考虑患病个体生物学特性的情况下对病人给予相同的治疗,对肿瘤实现个性化的精准诊疗。

    3.肿瘤预测预防个体化医学与精准医学的分子靶标研究

精准医学是以个体化医疗为基础、随着基因组测序技术快速发展以及生物信息与大数据科学的交互应用而发展起来的新型医学概念与医疗模式。其本质是通过基因组学、转录组学、蛋白质组学、代谢组学和影像组学等组学技术和医学前沿技术,对于大样本人群与特定疾病类型进行生物标记物的分析与鉴定、验证与应用,从而精确寻找到疾病的原因和治疗的靶点,并对一种疾病不同状态和过程进行精确分类,最终实现对于疾病和特定患者进行个体化精准治疗的目的,提高疾病诊治与预防的效益。

  精准医学是立足于基因组大数据之上的一种医学模式,首要目标是实现疾病的重新定义。传统的疾病分类主要基于临床症状和体征检查等,而精准医学的疾病分类则在此技术之上还要全面考量疾病发生的分子标志物、基因多态性、表型(蛋白质和代谢物)变异、居住环境、生活方式等相关信息,最终形成一个基于生物分子谱的疾病分类新模式。

   关于如何促进精准医学的发展,我们认为还是应该回归到个性化的预测、预防、诊断、治疗和预后评估。预测、预防、诊断、治疗和预后评估是人类健康保护过程不可逾越的阶段,对人类健康的重要性来说,预测/预防是上策,早期诊断/治疗是中策,晚期诊断/治疗是下策,精准医学严格来说应是个性化的精准预测、精准预防、精准诊断、精准治疗和精准预后评估。

  然而,要实现这些,人们必须转变一个观念:即从单因素模式转向多因素系统思维模式。组学(基因组学、转录组学、蛋白质组学、代谢组学、影像组学、相互作用组学)和系统生物学的发展推动了这一模式的快速转变,也促进了个性化医学的发展,因为人们可以对个体实现多组学分析、获得多参数指标用于个性化的预测、预防、诊断、治疗和预后评估。

作者简介:詹显全教授是山东第一医科大学教授,博士生导师,博士后合作导师,山东省泰山学者特聘专家,英国皇家医学院外籍院士;曾为中南大学湘雅医院教授,临床蛋白质组学与结构生物学专家;詹教授主要研究方向为肿瘤蛋白质组与蛋白质存在形式、肿瘤多组学与生物标志物、肿瘤预测预防个体化医学与精准医学的分子靶标。詹教授研究团队从多因素系统的思维模式来研究和预测、预防、诊断和治疗肿瘤,重点致力于应用组学和系统生物学技术从多参数系统策略角度阐述肿瘤的分子机理、发现肿瘤分子标志物,来实现肿瘤的预测、预防与个体化治疗和精准医疗。