User Login





      


需要账号密码联系我微信:bioinfoAndR



用于GEO芯片数据下载和ID转换

使用

image-20240219142140497
  • 输入GSE号

  • 分组名

    • 可以放空。也根据GEO页面这里的信息 输入要提取的字符,从而提取出分组名。不同的分组名之间用|分隔。所以在这个例子种输入 PBMCs_Control|PBMCs_IS image-20240219144249339
  • 上传本地的softgz文件 一般放空,不需要上传文件。当遇到网络问题,在线获取GEO数据失败时,可以上传需要的GSE号的softgz文件也可以得到结果 image-20240219144951211

注意事项

为了确保可以正常转换ID,可以点击进入GPL平台信息。确保有基因名的列或者GB_ACC的列

image-20240219145235918

如果没有基因名的列转换则使用GB_ACC id 再将GB_ACC id 转化为基因名 目前只适用于人



数据合并去除批次绘制PCA、箱线图

用于两个及两个以上的基因表达矩阵合并然后去除批次效应。

例子数据可通过 链接:https://pan.baidu.com/s/1zgSaVUOF1hClrvItAneLVQ 提取码:mzhs 进行获取。

使用可以参考: https://www.bilibili.com/video/BV1214y1r7eJ/?spm_id_from=333.999.0.0&vd_source=f32ebea580d0e0c98e4abed67d95d640

注意事项

如何输入多个文件

鼠标按下左键进行多选

基因表达矩阵,可以为csv或者txt

分组文件可以为csv或者txt,和基因表达矩阵保持一致的格式 都为csv 或者txt

Group为分组列 GSE_id为批次信息列

所以在页面中输入

去除批次效应所用到的方法选择

image-20240219151212565

标准化过的数据可使用前两个方法 。 count数据使用最后一种方法。

差异分析

可选择DESeq2 or edgeR or limma 对基因表达矩阵进行差异分析

例子数据可通过 链接:链接:https://pan.baidu.com/s/1glKN2qTTVwR9RCv8QSUuEQ 提取码:42y3 进行获取。

使用可以参考: https://www.bilibili.com/video/BV1Zj411k7X3/?spm_id_from=333.999.0.0&vd_source=f32ebea580d0e0c98e4abed67d95d640

  • 上传基因表达矩阵文件 行为基因,列为样本

  • 上传样本分组信息文件 行为样本,分组的列名记得设置为group!!!

  • 输入分组名称









热图参数

绘制差异基因热图

例子数据可从网盘连接获取:链接:https://pan.baidu.com/s/1olSnYXObJUPC3-m51rRXDg 提取码:2p07

使用可以参考:https://www.bilibili.com/video/BV1xb4y1N72k/?spm_id_from=333.999.0.0&vd_source=f32ebea580d0e0c98e4abed67d95d640

热图参数

绘制一般热图

例子数据可从网盘连接获取:链接:https://pan.baidu.com/s/1IqBLGl6MtEQk3Qydpniqow 提取码:x09r

进行GO、KEGG、Reactome富集分析并可视化

例子数据可从网盘连接获取:链接:https://pan.baidu.com/s/16IniCXs_gw_QqretCfyDIQ 提取码:uejn

使用可以参考:https://www.bilibili.com/video/BV1vN4y1H77Q/?spm_id_from=333.999.0.0&vd_source=f32ebea580d0e0c98e4abed67d95d640

进行GO、KEGG、Reactome富集分析并可视化

例子数据可从网盘连接获取:链接:https://pan.baidu.com/s/16IniCXs_gw_QqretCfyDIQ 提取码:uejn

使用可以参考:https://www.bilibili.com/video/BV1vN4y1H77Q/?spm_id_from=333.999.0.0&vd_source=f32ebea580d0e0c98e4abed67d95d640

进行GO、KEGG、Reactome富集分析并可视化

例子数据可从网盘连接获取:链接:https://pan.baidu.com/s/16IniCXs_gw_QqretCfyDIQ 提取码:uejn

使用可以参考:https://www.bilibili.com/video/BV1vN4y1H77Q/?spm_id_from=333.999.0.0&vd_source=f32ebea580d0e0c98e4abed67d95d640

对富集分析结果绘制花瓣图

例子数据可从网盘连接获取:链接:https://pan.baidu.com/s/16IniCXs_gw_QqretCfyDIQ 提取码:uejn

使用可以参考:https://www.bilibili.com/video/BV1qK4y1i7U5/?spm_id_from=333.999.0.0&vd_source=f32ebea580d0e0c98e4abed67d95d640

显示每个通路上的基因,每个基因一行

显示每个通路上的基因,每个通路一行

获取msigdb GO KEGG reactome 数据库上的通路基因集

使用可以参考:https://www.bilibili.com/video/BV1eN4y1J7iQ/?spm_id_from=333.999.0.0&vd_source=f32ebea580d0e0c98e4abed67d95d640

msigdb网站: GSEA | MSigDB | Human MSigDB Collections (gsea-msigdb.org) 网站包含了H和C1-C7的8个基因集集合(Collections)。 每个collection的描述、collection的子集的描述都在上述网站页面可以看到。

H和C1-C7八个系列(Collection),每个系列分别是:

  • H: hallmark gene sets (癌症)特征基因集合
  • C1: positional gene sets 位置基因集合,根据染色体位置,共326个,用的很少;
  • C2: curated gene sets:(专家)校验基因集合,基于通路、文献等(KEGG):
  • C3: motif gene sets:模式基因集合,主要包括microRNA和转录因子靶基因两部分
  • C4: computational gene set:计算基因集合,通过挖掘癌症相关芯片数据定义的基因集合;
  • C5: GO gene sets:Gene Ontology 基因本体论,包括BP(生物学过程biological process,细胞原件cellular component和分子功能molecular function三部分)
  • C6: oncogenic signatures:癌症特征基因集合,大部分来源于NCBI GEO 发表芯片数据
  • C7: immunologic signatures: 免疫相关基因集合。

常用的:

  • H: hallmark gene sets (癌症)特征基因集合

  • C2: curated gene sets:(专家)校验基因集合,基于通路、文献等(KEGG):

  • C5: GO gene sets:Gene Ontology 基因本体论,包括BP(生物学过程biological process,细胞原件cellular component和分子功能molecular function三部分)

显示每个通路上的基因,每个基因一行

显示每个通路上的基因,每个通路一行

获取msigdb GO KEGG reactome 数据库上的通路基因集

使用可以参考:https://www.bilibili.com/video/BV1eN4y1J7iQ/?spm_id_from=333.999.0.0&vd_source=f32ebea580d0e0c98e4abed67d95d640

msigdb网站: GSEA | MSigDB | Human MSigDB Collections (gsea-msigdb.org) 网站包含了H和C1-C7的8个基因集集合(Collections)。 每个collection的描述、collection的子集的描述都在上述网站页面可以看到。

H和C1-C7八个系列(Collection),每个系列分别是:

  • H: hallmark gene sets (癌症)特征基因集合
  • C1: positional gene sets 位置基因集合,根据染色体位置,共326个,用的很少;
  • C2: curated gene sets:(专家)校验基因集合,基于通路、文献等(KEGG):
  • C3: motif gene sets:模式基因集合,主要包括microRNA和转录因子靶基因两部分
  • C4: computational gene set:计算基因集合,通过挖掘癌症相关芯片数据定义的基因集合;
  • C5: GO gene sets:Gene Ontology 基因本体论,包括BP(生物学过程biological process,细胞原件cellular component和分子功能molecular function三部分)
  • C6: oncogenic signatures:癌症特征基因集合,大部分来源于NCBI GEO 发表芯片数据
  • C7: immunologic signatures: 免疫相关基因集合。

常用的:

  • H: hallmark gene sets (癌症)特征基因集合

  • C2: curated gene sets:(专家)校验基因集合,基于通路、文献等(KEGG):

  • C5: GO gene sets:Gene Ontology 基因本体论,包括BP(生物学过程biological process,细胞原件cellular component和分子功能molecular function三部分)

进行GSEA分析

参考: https://www.bilibili.com/video/BV1B84y1S77f/?spm_id_from=333.999.0.0&vd_source=f32ebea580d0e0c98e4abed67d95d640

例子数据可从网盘连接获取:链接:https://pan.baidu.com/s/1sF9yZU2SAg3oTLM-QNkz-w 提取码:ha1w

  • 上传基因列表文件 第一列为基因,第二列为logfc。不需要事先排序。

  • 上传通路基因集文件 第一列为通路名,第二列为该通路上的基因。

    该文件可从获取通路基因集模块获取

all就是展示全部通路

部分展示则输入 通路名;通路 使用英文的分号 GOBP_IMMUNE_RESPONSE_INHIBITING_SIGNAL_TRANSDUCTION;GOBP_IMMUNE_RESPONSE_TO_TUMOR_CELL

绘制韦恩图

注意最多只能支持四个分组 即只能上传四个文件

例子数据可从网盘连接获取链接:https://pan.baidu.com/s/19YbN-UfAxmad95Yv0tl0gQ 提取码:mcg6

使用可以参考:



./use_guide/draw_flower_venn_plot_mod.md

结果

输入

基因表达矩阵

样本生存信息

分割点确定 可以使用median中位数 也可以使用 函数确定最佳截断点

结果

输入

基因表达矩阵

样本生存信息

分割点确定 可以使用median中位数 也可以使用 函数确定最佳截断点

This is the second panel

This is the third panel