GSVA能够理解为pathway级别的不同分析

不同分析坚信行家答该是都异国题目了,就是跟着吾在生信技能树的教程走,自然也会有一些幼细节必要仔细,在 你确定你的不同基因找对了吗? 吾很益的示范了片面细节。

不同分析系列推文在:

解读GEO数据存放规律及下载,一文就够

解读SRA数据库规律一文就够

从GEO数据库下载得到外达矩阵 一文就够

GSEA分析一文就够(单机版+R说话版)

按照分组新闻做不同分析- 这个一文不足的

不同分析得到的效果注解一文就够

不过,标准分析清淡是不足的,定位到成百上千个有统计学隐微转折的不同外达基因后,同样是有成百上千个生物学功能注解(GO功能和KEGG通路),清淡的超几何分布检验已经不及已足行家众元化的分析了,于是就有了行家耳熟能详的GSEA分析,以及绝大片面人比较生硬的GSVA分析。

GSVA分析的文章发外于2013年,GSVA: gene set variation analysis for microarray and RNA-Seq data 同样是broad 钻研生出品,其在2005年PNAS发外的gsea已经高达1.4万的引用了,不过这个GSVA才不到300。往年吾就介绍过一波它的分析流程,在:行使GSVA手段计算某基因集在各个样本的外现 专门浅易的代码,于是各个培训机构,公司人员都开起学习和二次创作进而分享。考虑到比来邮箱授与的GSVA挑问比较众,吾这边照样得再次归纳总结一波,这次吾准备从GSVA其实就是pathway级别的不同分析的角度来分享。

清淡人做数据发掘,到不同基因的生物学功能注解(GO功能和KEGG通路)就终结了,进而也就是往行使一些网页工具,比如string,出一些花花绿绿的图外,比如PPI网络图。实际上,行使了GSVA,能够把成百上千个生物学功能注解(GO功能和KEGG通路)转换为新的外达矩阵,就是详细的每个通路在各个样本的基因集变异分析(Gene Set Variation Analysis,GSVA)值,吾们把它当作清淡的矩阵文件,进走不同外达分析,炎图绘制,火山图绘制。

下面吾们以文献 Metabolic remodeling contributes towards an immune‐suppressive phenotype in glioblastoma 为例,赏识它的两个图外,文章发外在Cancer Immunology, Immunotherapy (2019)

https://doi.org/10.1007/s00262-019-02347-3

基于pathway的炎图

图片

固然作者这边行使的代谢组学数据:

Global metabolomic profiling was performed on patient-derived glioblastoma (GBM; n=80) and LGA (n=28) tumor samples using LG/GC–MS.

内心上照样是记录外达量。

基于pathway的火山图

图片

pathway的详细含义

pathway在吾这边是其实想指代基因集的又名,其中msigdb有着雄厚的基因集,MSigDB(Molecular Signatures Database)数据库中定义了已知的基因荟萃:http://software.broadinstitute.org/gsea/msigdb

图片

包括H和C1-C7八个系列(Collection),每个系列别离是:

H: hallmark gene sets (癌症)特征基因荟萃,共50组,最常用;

C1: positional gene sets 位置基因荟萃,按照染色体位置,共326个,用的很少;

C2: curated gene sets:(行家)校验基因荟萃,基于通路、文献等:

C3: motif gene sets:模式基因荟萃,主要包括microRNA和转录因子靶基因两片面

C4: computational gene sets:计算基因荟萃,经由过程发掘癌症有关芯片数据定义的基因荟萃;

C5: GO gene sets:Gene Ontology 基因本体论,包括BP(生物学过程biological process,细胞原件cellular component和分子功能molecular function三片面)

C6: oncogenic signatures:癌症特征基因荟萃,大片面来源于NCBI GEO  发外芯片数据

C7: immunologic signatures: 免疫有关基因荟萃。