find_circ中如何识别环状RNA
发表于:2025-12-02 作者:千家信息网编辑
千家信息网最后更新 2025年12月02日,今天就跟大家聊聊有关find_circ中如何识别环状RNA,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。1. 比对参考基因组官方的pipeli
千家信息网最后更新 2025年12月02日find_circ中如何识别环状RNA
今天就跟大家聊聊有关find_circ中如何识别环状RNA,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。
1. 比对参考基因组
官方的pipeline使用的是bowtie2软件,代码如下
bowtie2 -p16 \--very-sensitive \--score-min=C,-15,0 \--mm \-x hg19 -q \-1 R1.fastq.gz -2 R2.fastq.gz \2> bowtie2.log \| samtools view -hbuS - \| samtools sort - accepted_hits
最终生成了一个排序之后的bam文件,其实这一步选择其他的比对软件,比如hisat也是可以的,只需要产生bam文件就可以了。
2. 提取没比上参考基因组的序列
采用samtools软件提取没比对上的序列,代码如下
samtools view -hf 4 accepted_hits.bam | samtools view -Sb - > unmapped.bam
3. 从序列两端提取锚点序列
代码如下
unmapped2anchors.py unmapped.bam anchor.fq
4. 将锚点序列比对参考基因组
bowtie2 -p 16 \--reorder \--mm \--score-min=C,-15,0 \-q -x human_bowtie2_index \-U anchor.fq \-S align.sam
5. 预测circRNA
代码如下
cat align.sam | find_circ.py -G hg19.fa -p hsa_ > splice_sites.bed
结果如下所示

-p参数指定的是第四列内容的前缀,建议指定为物种对应的三字母缩写,需要注意的是,在sites.bed中同时包含了环状RNA和线性RNA,环状RNA的名称用circ标识,线性RNA的名称用norm标识。
6. 结果筛选
根据以下规则对结果进行筛选
根据关键词CIRCULAR筛选环状RNA
去除线粒体上的环状RNA
筛选unique junction reads数至少为2的环状RNA
去除断裂点不明确的环状RNA
过滤掉长度大于100kb的circRNA,这里的100kb为基因组长度,直接用环状RNA的头尾相减即可
代码如下
grep CIRCULAR splice_sites.bed | \grep -v chrM | \ awk '$5>=2' | \grep UNAMBIGUOUS_BP | \grep ANCHOR_UNIQUE | \./maxlength.py 100000 \> circ_candidates.bed
看完上述内容,你们对find_circ中如何识别环状RNA有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注行业资讯频道,感谢大家的支持。
环状
代码
序列
内容
基因
基因组
结果
软件
参考
名称
文件
标识
线性
长度
两端
关键
关键词
前缀
参数
同时
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
广东智能软件开发咨询
车辆管理系统导入数据库文件
英文化学期刊数据库
小学初中网络技术基础
租流量服务器
边缘网络服务器配置
腾策数据库
哪些网游没有服务器
矿产资源规划数据库标准
数据库的数据模型的是
led户外显示屏网络安全管理
y-str数据库查询原则
中国金融科技软件开发公司排名
视频监控网络安全信息表
计算机网络技术建设论文
微信公从号服务器
软件开发5年了还需要考研吗
数据库发生死锁
苹果12id服务器验证失败原因
有哪些服务器很好玩我的世界
网络安全应注意的问题
江阴机电软件开发注意事项
王者数据库
腾策数据库
南通计算机网络技术应用
华为服务器imana
常熟软件开发
java数据库统计图
可以看到彩票数据库吗
舟山财务软件开发公司报价