HiC-Pro怎么用
发表于:2025-12-01 作者:千家信息网编辑
千家信息网最后更新 2025年12月01日,这篇文章主要为大家展示了"HiC-Pro怎么用",内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下"HiC-Pro怎么用"这篇文章吧。HiC-Pro软件非常灵活,
千家信息网最后更新 2025年12月01日HiC-Pro怎么用
这篇文章主要为大家展示了"HiC-Pro怎么用",内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下"HiC-Pro怎么用"这篇文章吧。
HiC-Pro软件非常灵活,不仅可以处理各种不同建库方式的Hi-C数据,也可以处理capture Hi-C数据。软件安装过程如下
yum install -y epel-release
# R
yum install -y R
R
install.packages(c("ggplot2", "RColorBrewer"))
# python
yum install -y gcc gcc-c++ make
yum install -y python2 python-devel python2-pip
pip install pysam
pip install "scipy<1"
pip install bx-python
# bowtie2
yum install -y wget
wget https://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.3.4.1/bowtie2-2.3.4.1-linux-x86_64.zip
unzip bowtie2-2.3.4.1-linux-x86_64.zip
# samtools
yum install bzip2 bzip2-devel libcurl libcurl-devel ncurses-devel openssl openssl-devel
wget https://github.com/samtools/samtools/releases/download/1.6/samtools-1.6.tar.bz2
tar xjvf samtools-1.6.tar.bz2
cd samtools-1.6/
./configure
make
make install
# HiC-Pro
wget https://github.com/nservant/HiC-Pro/archive/v2.11.1.tar.gz
tar xzvf v2.11.1.tar.gz
cd HiC-Pro-2.11.1
make configure
make install安装好之后,需要准备以下几种参考物种的相关文件
1. 酶切图谱
通过软件自带的脚本可以产生基因组对应的酶切图谱,输入内切酶的名称或者酶切位点序列都可以,用法如下
digest_genome.py -r A^AGCTT -o mm9_hindiii.bed mm9.fasta
digest_genome.py -r hindiii -o mm9_hindiii.bed mm9.fasta2. 参考基因组索引
软件采用bowtie2将reads比对到参考基因组上,所以需要对基因组的fasta文件建立索引,用法如下
bowtie2-build hg19.fasta hg19
3. 染色体长度文件
从UCSC下载染色体长度文件,或者自己根据fasta序列统计长度都可以,该文件内容如下
chr1 249250621
chr2 243199373
chr3 198022430
chr4 191154276这里我们用官网提供的测试数据展示下基本用法,首先下载测试数据
wget --no-check-certificate https://zerkalo.curie.fr/partage/HiC-Pro/HiCPro_testdata.tar.gz
tar xzcf HiCPro_testdata.tar.gzHiC-Pro的所有参数都记录在配置文件中,安装目录提供了配置文件的模板config_test_latest.txt`, 在此基础上进行编辑就可以了。常见的需要配置的参数如下
BOWTIE2_IDX_PATH = /data/annotation/Human/hg19/base
REFERENCE_GENOME = hg19
GENOME_SIZE = chrom_hg19.sizes
GENOME_FRAGMENT = HindIII_resfrag_hg19.bed
LIGATION_SITE = AAGCTAGCTT对于这个测试文件,只需要编辑bowtie2索引所在目录就可以了,编辑好之后直接运行,用法如下
HiC-Pro -i test_data/ -o out_dir -c config_test_latest.txt
用法非常简单,-i参数指定样本fastq文件文件所在目录,-o参数指定输出结果的目录,-c参数指定配置文件的名称。
对于fastq文件所在目录,结构如下所示
├── dixon_2M
│ ├── SRR400264_00_R1.fastq.gz
│ └── SRR400264_00_R2.fastq.gz
└── dixon_2M_2
├── SRR400264_01_R1.fastq.gz
└── SRR400264_01_R2.fastq.gz每个样本一个子文件夹,下面是对应的双端测序的fastq文件。输出结果目录如下
|-- bowtie_results
|-- config_test_latest.txt
|-- hic_results
|-- logs
|-- rawdata -> /HiC-Pro-2.11.1/test_data/
`-- tmp其中hic_results目录下是最终结果,包含了不同分辨率下的hi-c图谱和质控的图表。
以上是"HiC-Pro怎么用"这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注行业资讯频道!
文件
目录
参数
内容
基因
基因组
数据
软件
配置
图谱
所在
篇文章
索引
结果
长度
参考
测试
不同
名称
序列
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
数据库名和表名不区分大小写
郑州网络安全创意大赛颁奖
服务器装材质包我的世界
关于小牛君的服务器
数据库的归档值得是什么
软件开发项目总结 模板
数据库备份到阿里
无法核实服务器证书
计算机网络技术基础阚宝明版
网络安全泄密
动环系统是什么服务器
如何选择好的眼镜行业软件开发
奉贤区高科技软件开发推荐厂家
浦口区智能化软件开发售后服务
服务器端口转发软件
数据库来管理银行系统索引
盗版我的世界如何进服务器
把数据导入数据库etl
怎样将数据写入数据库
网络安全对xiao学生
分离数据库之后原数据库在哪里找
牛牛app软件开发
oracle数据库规划
ifix连接数据库速度慢
武汉服务器数据恢复
浙江专业软件开发靠谱吗
安全优质服务器
在非系统盘创建数据库目录
数据库优化复习第二章
有哪些无线网络技术呢