千家信息网

featureCounts中怎么实现定量分析操作

发表于:2025-12-03 作者:千家信息网编辑
千家信息网最后更新 2025年12月03日,本篇文章给大家分享的是有关featureCounts中怎么实现定量分析操作,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。featureC
千家信息网最后更新 2025年12月03日featureCounts中怎么实现定量分析操作

本篇文章给大家分享的是有关featureCounts中怎么实现定量分析操作,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。

featureCounts集成在subreads 软件中, 类似 word 和 office 的关系, subreads 这个软件也有对应的 R包Rsubreads

featureCounts 需要两个输入文件:

  1. 比对产生的BAM/ SAM文件

  2. 区间注释文件


对于区间文件而言,支持以下两种格式

  1. GTF 格式

  2. SAF 格式


GTF格式在之前的文章中详细介绍过,这里看下SAF格式,示例如下

GeneID    Chr    Start    End    Strand497097    chr1    3204563    3207049    -497097    chr1    3411783    3411982    -497097    chr1    3660633    3661579    -

就是\t分隔的5列文件,记录了基因的染色体上的区间和正负链信息。

在featureCounts 软件中,有两个核心概念:

  1. feature

  2. metafeature


feature指的是基因组区间的最小单位,比如exon; 而metafeature可以看做是许多的feature构成的区间,比如属于同一个gene的外显子的组合。

在定量的时候,支持对单个feature 定量(对外显子定量), 也支持对meta-feature 进行定量(对基因进行定量)。

当reads 比对到2个或者以上的features 时,默认情况下,featureCounts在统计时会忽略到这部分reads, 如果你想要统计上这部分reads, 可以添加-O 参数,此时一条reads 比对到多个feature, 每个feature 定量时,都会加1,对于meta-features 来说,如果比对到多个features 属于同一个 meta-features(比如一条reads比对到了exon, 但这些exon 属于同一个gene), 则对于这个gene 而言,只会计数1次。

总之,不管对于feature 还是meta-feature, 只有比对多个不同的区间时,才会分别计数。

features 支持对单个样本定量,还支持对多个样本进行归一化。单个样本定量的用法如下

featureCounts -T 5  \ -t exon \ -g gene_id \-a annotation.gtf \-o counts.txt \mapping.sam

多个样本归一化的用法如下

featureCounts \-t exon \-g gene_id \-a annotation.gtf \-o counts.txt \ library1.bam library2.bam library3.bam

-a参数指定的区间注释文件,默认是gtf格式;-T参数指定线程数,默认是1;-t参数指定想要统计的feature的名称,取值范围是gtf 文件中的第3列的值,默认是exon;-g参数 指定想要统计的meta-feature的名称,取值范围参考gtf第9列注释信息,gtf的第9列为key=value的格式,-g参数可能的取值就是所有的key, 默认值是gene_id。

输出的表达量文件内容示意如下

# Program:featureCounts v1.6.0; Command:"./featureCounts" "-T" "20" "-t" "exon" "-g" "gene_id" "-a" "hg19.gtf" "-o" "gene" "accepted_hits.bam"Geneid Chr Start End Strand Length accepted_hits.bamDDX11L1 chr1;chr1;chr1 11874;12613;13221 12227;12721;14409 +;+;+ 1652 0

#号开头的注释行,记录了运行的命令;Geneid开头的行是表头,Geneid代表统计的meta-features的名称,Chr,Start,End对应染色体上的位置,Strand代表正负链,由于一个基因有多个外显子构成,所以这里的染色体位置信息有多个,和外显子个数一一对应。

Length 该区间的长度,最后一列的表头是你的输入文件的名称,代表的是这个meta-feature的表达量。

以上就是featureCounts中怎么实现定量分析操作,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注行业资讯频道。

文件 区间 多个 格式 参数 支持 统计 名称 基因 样本 注释 代表 信息 单个 就是 染色体 软件 染色 定量分析 分析 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 虚拟机怎么搭建CA服务器 小学生网络安全管理方案 北京沃高网络技术公司 会议服务器的制作 教务系统舆情与网络安全 上海商学院中本贯通网络安全 管理独立服务器后的结果 数据库成果应用设想 人工智能辅助决策网络安全 易递通网络技术有限公司 ctf网络安全大赛存在吗 软件开发预付款一般给多少 福州福昕网络技术有限公司客服 易语言频繁读写数据库闪退 什么是数据库安全系统 u8材料出库单数据库 世界第一个服务器的诞生 高速网络技术课件 发自内心的去做网络安全 opcua数据库 网站用的数据库是自己编的吗 丹东市网络安全态势感知平台 维护网络安全的英文 收款音响提示连接服务器失败 北京网络营销软件开发职责 嵌入式软件开发能力的方法 多媒体网络技术 教学 简述数据库管理的数据存取过程 礼泉天气预报软件开发 网络安全服务的收入有哪些内容
0