怎么使用R语言的clusterProfiler对葡萄做GO富集
发表于:2025-12-04 作者:千家信息网编辑
千家信息网最后更新 2025年12月04日,本篇内容主要讲解"怎么使用R语言的clusterProfiler对葡萄做GO富集",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"怎么使用R语言的cluste
千家信息网最后更新 2025年12月04日怎么使用R语言的clusterProfiler对葡萄做GO富集基本流程是image.png image.png image.png image.png
本篇内容主要讲解"怎么使用R语言的clusterProfiler对葡萄做GO富集",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"怎么使用R语言的clusterProfiler对葡萄做GO富集"吧!
Hiast2 比对 samtools sam 转bam stringtie组装转录本 gffcompare将stringtie输出的gtf文件与参考基因组的注释文件做比较得到一- 个merged.combine.gtf 使用merged.combine.gtf 这个文件对每个样本计算表达量,输出文件存储到ballgown文件夹下,这一步用到的命令是 stringtie -e -B -p 8 -G merged.combined.gtf -o ballgown/L01/L01.gtf output_bam/L01.sorted.bam
接下来是R语言的ballgown包读入数据获取基因和转录本的表达量 代码是
library(ballgown)
library(genefilter)
library(dplyr)
pheno_data<-read.csv("pheno_data.txt",header=T)
grape_expr <- ballgown(dataDir = "ballgown",
samplePattern = "L0",
pData = pheno_data)
这一步可以拿到gene_id还有gene_name ,FPKM的表达量,cov对用的应该是reads count吧。
接下来是差异表达分析
代码是
grape_expr_filter<-subset(grape_expr,
"rowVars(texpr(grape_expr))>1",
genomesubset=T)
results_genes <- stattest(grape_expr_filter,
feature = "gene",
covariate = "time_point",
getFC = TRUE,
meas = "FPKM")
#results_genes <- arrange(results_genes,pval)
results_genes%>%
filter(abs(fc)>=2&pval<0.05) -> results_genes_diff
dim(results_genes_diff)
head(results_genes_diff)
现在有了基因id
接下来是使用clusterProfiler做go注释
这里参考 https://guangchuangyu.github.io/cn/2017/07/clusterprofiler-maize/#disqus_thread
首先把这个基因id对应着转换成 ENTREZID ,这里需要借助对应的gtf注释文件
这里只关注蛋白编码基因
grep 'gene_biotype "protein_coding"' 12X_genomic.gtf > 12X_protein_coding.gtf
#python
from gtfparse import read_gtf
known_proteincoding = read_gtf("12X_protein_coding.gtf")
known_proteincoding.to_csv("all_protein_coding.csv")
GO富集分析的R语言代码
require(AnnotationHub)
hub<-AnnotationHub() #这一步对网路有要求
# aa<-query(hub,'zea')
# aa$title
# query(hub,'Malus domestica')
bb<-query(hub,"Vitis vinifera")
#bb$title
grape<-hub[['AH85815']]
# length(keys(grape))
# columns(grape)
protein_coding_all<-read.csv("all_protein_coding.csv",header=T)
df<-merge(results_genes_diff,grape_expr_filter@expr$trans,by.x="id",by.y="gene_id")
df1<-merge(df,protein_coding_all,by.x="gene_name",by.y="gene_id")
dim(df1)
gene_ids<-
df1$db_xref[!duplicated(df1$db_xref)]
gene_ids<-stringr::str_replace(gene_ids,"GeneID:","")
library(clusterProfiler)
bitr(keys(grape)[2],'ENTREZID',c("REFSEQ","GO",
"ONTOLOGY","GENENAME",
"SYMBOL"),grape)
res = enrichGO(gene_ids,
OrgDb=grape, pvalueCutoff=0.05, qvalueCutoff=0.05)
help(package="clusterProfiler")
dotplot(res)
最后的结果是
到此,相信大家对"怎么使用R语言的clusterProfiler对葡萄做GO富集"有了更深的了解,不妨来实际操作一番吧!这里是网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!
文件
语言
基因
富集
葡萄
接下来
代码
注释
内容
分析
参考
学习
输出
实用
更深
兴趣
命令
基因组
实用性
实际
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
2017年 网络安全威胁
oracle数据库乐观锁
国家网络安全空间人才网
5g时期的网络安全
武汉软件开发驻场代理
广州智远合创网络技术有限公司
同步时间的服务器
教育系统采用什么数据库
上海徳颐网络技术有限公司
物理层软件开发工程师视频
必火网络安全就业率
网站与网络技术
网络安全校园贷
全民奇迹数据库修改
交通广播服务器繁忙
写入代理服务器设置时出错
公司内网连不了服务器了
西安升腾互联网科技有限公司
嵌入式软件开发学习路线
戴尔服务器更改硬盘启动项
discord服务器币圈
你的网络无法连接到服务器lol
海淀区软件开发
软件开发需多少资金
广东常用软件开发报价表
软件开发专业学费会不会很贵
网络安全法窃取个人信息
dell服务器 管理口
丰台科技园有什么互联网公司
交通广播服务器繁忙