学会这些招 | 快速从诸多差异物中锁定潜在目标代谢物-国内聚焦-资讯-生物在线

学会这些招 | 快速从诸多差异物中锁定潜在目标代谢物

作者:麦特绘谱生物科技(上海)有限公司 暂无发布时间 (访问量:7772)

在代谢组学结果分析中,尤其是在疾病及治疗机制研究过程中,快速准确地找到差异代谢物,进而从中锁定潜在的目标生物标志物或功能验证代谢物至关重要。本文旨在介绍一系列技术策略和方法,以帮助研究者提高筛选效率,确保研究的准确性和可靠性。

1. 筛选差异代谢物

代谢组学差异分析是代谢组学研究中不可或缺的一环,其目的在于通过比较不同组别间的代谢物表达水平,筛选出具有显著差异的代谢物。这些差异代谢物能够作为生物体生理或病理状态的重要指示,为疾病的诊断、治疗和预防提供有价值的线索。在代谢组差异分析中,常用的方法包括以下几种:

1.1 多维统计分析

代谢组学数据具有多维性,且某些变量间可能高度相关,仅运用传统的单维分析无法快速、充分、准确地挖掘数据内潜在的信息。因此对采集的多维数据,一般进行如下变量分析,进而挖掘和提炼更有用的信息。

● 主成分分析(PCA):PCA是一种广泛使用的数据降维算法,它通过找出数据矩阵的方差最大方向作为第一主成分(PC1),然后在与PC1正交的平面中找出方差最大的方向作为第二主成分(PC2),以此类推。通过这种方式,PCA可以将高维数据映射到低维空间帮助分析和概览整个数据集,揭示数据集中的自然聚类趋势、分组差异以及离群值。

PCA可用于寻找离群点(outlier),但对于离群点的处理需谨慎,不建议简单粗暴地删除,某些离群点可能是有趣且值得深究的。研究人员需要仔细地排查离群究竟是因为采样、前处理、检测等环节引入的误差还是客观的生物学差异引起的。

偏最小二乘判别分析(PLS-DA):PLS-DA结合了降维和回归模型,通过多元线性回归技术找到数据集和类别标签之间的最大协方差方向,建立潜在关联的分析方法。

● 正交偏最小二乘判别分析(OPLS-DA): OPLS-DA根据类别Y将数据集X的差异分为两个部分,一部分代表与Y相关的差异,另一部分代表与Y不相关的差异。OPLS-DA可以更好地区分组间差异,提高模型的有效性和解析能力。PLS-DA适用于两组及以上组别的分类比较,而OPLS-DA通常用于两组的对比分析。

● 置换检验(Permutation test):使用OPLS-DA时,存在数据过度过滤的风险,因此必须进行严格的统计验证。置换检验(Permutation test)是较为常用的多维模型检验方式,常和Q2结合使用。其原理是将每个样本的分组标签随机打乱,重新建模和预测。一个可靠模型的Q2应当显著大于将数据随机打乱建模后得到的Q2。基于置换检验的结果,可以画出Permutation plot。该图展示了置换检验得到的分组变量和原始分组变量的相关性以及对应的Q2值,虚线为回归线。

1.2 单维统计分析

单维统计分析包括参数检验中的T检验、方差分析(ANOVA),非参数检验中的Mann-Whitney U检验、Kruskal-Wallis检验等方法,用于区分变量是否具有统计显著性。在代谢组学中,根据数据是否服从正态分布及方差齐性,选择对应的单维检验方法。通常,若某代谢物数据各组均服从正态分布以及方差齐性,用参数检验(两两比较采用T检验,两组以上采用ANOVA),有一个不满足则用非参数检验(两两比较采用Mann-Whitney U检验,两组以上采用Kruskal-Wallis检验)。

1.3 差异代谢物筛选

差异代谢物的筛选通常会结合单维与多维统计分析方法。两两比较中的多维差异筛选通常基于OPLS-DA模型,它将与分组相关的所有信息集中在第一主成分上,更易于进行模型解释。筛选的标准通常是基于VIP (Variable importance in the projection),描述了每一个变量对模型的总体贡献,通常设定阈值为VIP>1。单维差异筛选通常基于单维检验的P值<0.05,变化倍数(FC,Fold change),火山图(Volcano plot)等都是常用的筛选工具。

根据差异代谢物的筛选指标,优先关注P值越小、变化倍数越大(FC的异常大和异常小)、VIP值越大的差异代谢物,对这部分代谢物进行相关生物学功能文献调研,当生物学功能比较明确时,可以进一步选择其他中心临床大样本集、相关疾病模型的动物水平样本、细胞水平样本等开展多水平的验证性试验,当显著的差异代谢物在临床大样本集得到确认后可进行ROC等分析进一步筛选潜在生物标志物。

首先需要明确具体差异代谢物的功能,可用代谢物名称在HMDB数据库查询了解初步的功能,再结合代谢物和功能或疾病(如胃癌、IBD、动脉粥样硬化、高血压、阿兹海默病…)等关键词搜索相关文献进行总结。在诸多的代谢通路中根据文献总结结果锁定与课题最匹配的通路进行验证性研究。

2. 代谢通路分析

通过上述方法筛选到差异代谢物后,还需要挖掘和这些代谢物相关的代谢通路。此时,可以采用MetaboAnalyst网站(http://www.metaboanalyst.ca/)进行代谢通路分析(Metabolic pathway analysis)绘谱君已整理完整操作教程:超实用工具 | 代谢组学MetaboAnalyst 5.0通路富集分析 ,代谢通路分析分为富集分析(Enrichment analysis)和通路分析(pathway analysis)。通路分析中添加了通路拓扑分析(topology analysis),会输出通路在整体网络中的重要性(impact)。通过差异代谢物进行通路富集分析,富集到显著变化的代谢通路后,可以锁定差异代谢物上下调变化及上下游代谢物,进而锁定相关作用的酶即蛋白,验证酶的变化情况是否与代谢物变化的相一致。

3. 机器学习算法进行建模分析

机器学习算法在代谢组学中的应用可以帮助研究者从复杂的代谢物数据中发现模式、识别生物标志物和理解生物学过程。通过对差异代谢物进行进一步筛选,作为进一步诊断实验及寻找生物标志物的候选来源。

● 逻辑回归(Logistic Regression):是一种基础的统计方法,模型结构简单,容易理解和实现。它用于处理二分类问题,预测事件发生的概率。在代谢组学研究中,当目标是区分不同疾病状态或不同生物学状态时,常使用该方法预测新样本属于特定类别的概率。

● 随机森林(Random Forest):它是一种集成学习方法,通过构建多个决策树并将它们的预测结果结合起来,以提高模型的准确性和稳定性。在代谢组学中,随机森林可以分析大量代谢物之间的关系,帮助找到与疾病、治疗效果等相关的重要代谢物。它能够处理复杂的代谢数据并提供有用的见解。

● 支持向量机(Support Vector Machine, SVM):它是一种强大的分类器,通过找到数据点之间的最优边界来区分不同的类别。在代谢组学中,支持向量机可以用于分类任务,比如区分健康与病态样本。它能够在复杂的代谢物数据中找到明显的分类边界,从而帮助研究人员更好地理解生物过程。

这三种方法各有优缺点,在代谢组学中有广泛应用。它们可以帮助研究人员从复杂的代谢数据中提取有价值的信息,识别潜在的疾病标志物。

4. 多组学数据整合分析

通过整合代谢组学、转录组学、蛋白质组学、微生物组学等多组学数据,可以显著提高生物标志物筛选的准确性。具体来说,结合差异代谢物与其他组学数据(基因组、转录组、蛋白组、菌群16S、临床指标)筛选到的差异基因、差异蛋白、差异菌群和临床指标等进行关联分析,探讨它们是否能映射到相同通路,进而解释相同的生物学功能;同时,通过建立各组学变量之间的相关性,从阳性关联对的角度,可以验证实验结果,进一步探索组学间的因果关系。多组学分析能够覆盖生物体内的多个层面,提供更完整的生物学信息。这种全面性有助于揭示生物体在不同条件下的分子反应和调控网络,从而为疾病机理、药物作用机制等研究提供更全面的视角。

通过上述几种方法结合使用、多重筛选和互相验证,即可以得到确定变化的潜在目标代谢物,进一步推进临床和生物标志物的研究。

5. 解析差异物中锁定目标代谢物典型案例

5.1 贾伟院士科研团队研究案例

 ● Advanced Science | 代谢组+菌群揭示促进胃癌发生新机制

本文是研究某一代谢物的经典思路:代谢组+宏基因组聚焦到结合型胆汁酸TDCA,(通过代谢物与临床指标最强相关性的代谢物进行聚焦),后通过添加代谢物、单菌移植分别在细胞水平和小鼠水平验证,全面揭示其作用机制。

纳入健康人(n=50)、胆汁反流性胃炎患者(BRG,n=50)和胃癌患者(GC,n=45)胃液进行胆汁酸检测,BRG和GC患者胃液结合型胆汁酸水平显著升高。相关性分析发现,BRG和GC患者中TDCA水平与胃液pH值的改变呈现最强的正相关(通过代谢物与临床指标最强相关性的代谢物进行聚焦)。随后开展添加代谢物、单菌移植分别在细胞水平和小鼠水平验证实验及机制研究,全面揭示胆汁酸和微生物在胆汁反流性胃炎、胃癌中的重要作用及分子机制:肠道菌及代谢物通过激活IL-6/JAK1/STAT3通路促进胃癌前病变的发生。并指出中药丹参中的一种有效成分隐丹参酮能有效抑制胆汁反流引起的胃癌前病变。

5.2 麦特绘谱客户研究案例

 ● Microbiome | 肠道菌群与代谢促进多发性骨髓瘤发病新机制

本研究是研究某一代谢物的常用思路:宏基因组+代谢组聚焦到氮循环代谢物(通过多组学策略中的宏基因组通路富集结果进行代谢物的联系和聚焦),随后通过粪菌移植、单菌移植以及代谢物的饮食剥夺进行干预验证,全面揭示其作用机制。

纳入19例MM患者和18例性别和年龄相匹配的健康对照组(HC)进行粪便样本的宏基因组测序和代谢组学检测,其中,宏基因组的通路模块分析中氮循环的硝化和反硝化显著富集,推测MM中的优势菌可能是由宿主的氮积累引起的(通过多组学策略中的宏基因组通路富集结果进行代谢物的联系和聚焦)。随后开展随后通过粪菌移植、单菌移植以及代谢物的饮食剥夺进行干预验证实验及机制研究,全面揭示:MM患者中骨髓微环境中氨基酸异常,导致血中尿素累积,氮源循环微生物增殖;氮循环微生物致使尿素降解、谷氨酰胺从头合成增加,从而加速宿主MM进程。提示通过干预MM患者的肠道菌群可作为MM治疗的新靶标。

 ● Cell Discovery | 眼-肠轴新发现:色氨酸肠菌代谢物吲哚-3-乙酸通过促进I型胶原合成抑制高度近视进展

本研究也是研究某一代谢物的常用思路:16S+代谢组发现吲哚-3-乙酸,3-IAA(通过单维进行筛选和聚焦)在高度近视组(HM)下降最为显著。小鼠进行3-IAA灌胃处理、3-IAA处理人胚胎眼巩膜成纤维细胞(HFSFs)缓解HM进展并探究机制。

纳入52名HM(高度近视)患者、45名健康(HC)对照作为发现队列;另外纳入26名HM(高度近视)患者、23名健康(HC)对照作为验证队列。使用Q300全定量靶向代谢组学技术检测血浆样本,发现HM组内的吲哚水平显著下降,其中3-IAA下降最为显著(通过单维进行筛选和聚焦)。且其水平的降低与HM的严重程度呈负相关,随后开展对3-IAA的后续验证,全面揭示,肠道微生物来源的代谢产物吲哚-3-乙酸(3-IAA)通过促进I型胶原蛋白合成来抑制高度近视进展。因此这种以微生物群为中心的抗HM效应可能通过每日补充3-IAA为高度近视的干预开辟新的治疗途径。

5.3 主刊和顶刊研究案例

 ● Nature | 菌群代谢物3-IAA显著提升胰腺癌化疗疗效

研究某一代谢物的范例:16S+代谢组发现吲哚-3-乙酸(通过单维进行筛选和聚焦)在免疫治疗有效患者中增加。粪便菌群移植、膳食补充色氨酸和口服3-IAA增加PDAC小鼠化疗疗效并探究机制。最后,临床队列验证3-IAA的水平和化疗疗效显著相关。

招募30名mPDAC患者,其中23名未接受抗生素治疗,在化疗开始前收集其粪便样本对肠道菌群进行分析。为了研究菌群与化疗反应之间的潜在因果关系,将前10名招募的R和NR组的菌群转移到无菌小鼠体内,然后注射胰腺癌KPC细胞。收集R和NR组的患者血清以及相匹配的定植小鼠的血清,进行靶向代谢组学检测。结果显示,与NR组相比,色氨酸代谢物吲哚-3-乙酸(3-IAA)是R组中显著增加最多的代谢物(通过单维进行筛选和聚焦)。随后开展对3-IAA的后续验证。全面揭示,菌群代谢物吲哚-3-乙酸(3-IAA)与治疗效果之间存在显著相关性,并提示化疗联合特定营养干预或能改善PDAC(甚至其他癌症)疗效。

 ● Cell Metabolism | 菌群-脯氨酸代谢调控抑郁症

本研究是多组学经典思路:临床队列的代谢组+宏基因组聚焦到脯氨酸(通过代谢物与临床指标最强相关性的代谢物进行聚焦),补充脯氨酸、粪菌移植、敲低及单菌移植在动物上验证,全面揭示脯氨酸的肠脑轴作用机制。

首先对纵向发现队列(IRONMET,n=116)的血浆和粪便样本进行代谢组学分析,基于机器学习变量选择策略筛选出几种与PHQ-9评分相关的代谢物。通过另一个独立验证队列(IMAGEOMICS,n=919)血浆样本进行验证。其中两个队列最一致的发现是,血浆脯氨酸与抑郁评分的强正相关(通过代谢物与临床指标最强相关性的代谢物进行聚焦)。且通过食物频率问卷对常规营养素、维生素、矿物质、氨基酸和脂肪酸与发现队列(IRONMET)PHQ-9评分进行分析。结果显示,脯氨酸是对抑郁症影响最大的因素。于是聚焦脯氨酸并开展后续验证。全面揭示,依赖于肠道菌群的脯氨酸代谢变化对抑郁症的影响,并提示靶向菌群/膳食脯氨酸或可有效改善抑郁。

参考文献

1.Multivariate Analysis in Metabolomics. Curr Metabolomics. 2013.

2.Assessment of PLSDA cross validation. Metabolomics. 2008.

3.CV-ANOVA for significance testing of PLS and OPLS® models. J. Chemometrics. 2008.

4.Bile Acid–Microbiome Interaction Promotes Gastric Carcinogenesis. Advanced Science. 2022.

5.Alterations of gut microbiome accelerate multiple myeloma progression by increasing the relative abundances of nitrogen-recycling bacteria. Microbiome. 2020.

6.Gut microbiota-derived indole-3-acetic acid suppresses high myopia progression by promoting type I collagen synthesis. Cell Discovery. 2024.

7.Microbiota-derived 3-IAA influences chemotherapy efficacy in pancreatic cancer. Nature. 2023.

8.Microbiota alterations in proline metabolism impact depression. Cell Metabolism. 2022.

麦特绘谱生物科技(上海)有限公司 商家主页

地 址: 上海市浦东新区秀浦路2555号康桥商务绿洲E6栋5层

联系人: 林景超

电 话: 400-867-2686

传 真: 021-20900216

Email:marketing@metaboprofile.com

相关咨询
ADVERTISEMENT