千家信息网

怎么用gdc-client批量下载TCGA数据

发表于:2025-12-02 作者:千家信息网编辑
千家信息网最后更新 2025年12月02日,怎么用gdc-client批量下载TCGA数据,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。GDC的在线下载功能只适用于
千家信息网最后更新 2025年12月02日怎么用gdc-client批量下载TCGA数据

怎么用gdc-client批量下载TCGA数据,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。

GDC的在线下载功能只适用于下载小的数据集,当需要下载数据量较大的TCGA数据时,必须借助于GDC官方提供的客户端工具gdc-client。网址如下

https://gdc.cancer.gov/access-data/gdc-data-transfer-tool

该软件是一个命令行工具,支持windows, linux, mac OS多种操作系统,可以通过以下两种方法来下载文件

1. Manifest

首先通过GDC在线数据库筛选自己感兴趣的数据集,然后通过购物车图标将数据集添加到购物车中,示意如下

点击导航栏的Cart按钮,点击下载Manifest文件

该文件内容如下所示

第一列为文件的uuid, 在GDC数据库中,所有的信息都用一个uuid唯一标识。利用manifest文件批量下载的用法如下

gdc-client download -m gdc_manifest_20190610_105445.txt

结果下载到当前目录,每个文件保存在uuid对应的文件夹下,示意如下

这里我下载的是FPKM的基因表达量,文件内容如下

可以看到没有表头信息,而且每个样本是分开的,在实际使用中,我们通常需要整合到一张表中,得到一个行为基因,列为样本的基因表达量的表格。通过这种方式下载的数据,没有文件对应的样本信息,这个信息可以通过下载SampleSheet得到,该文件的内容如下

保存了每个样本对应的样本等信息,通过结合这个数据,可以整理得到基因表达量的表格。

2. UUID

第二种方式直接使用文件对应的uuid进行下载, 点击文件名称,可以看到UUID的信息,如下所示

通过uuid下载文件的用法如下

gdc-client download cadfedcc-2742-42ad-9fd3-733d01086392

这两种方式本质上是一样的,都是通过文件的uuid来对应到唯一的一个文件,并进行下载。需要注意的是,这种方式只能够下载得到原始文件,如果需要下游分析,需要自己调整文件格式。

看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注行业资讯频道,感谢您对的支持。

文件 数据 信息 样本 内容 基因 方式 可以通过 工具 数据库 表格 购物车 在线 帮助 支持 购物 原始 清楚 较大 操作系统 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 网络安全宣传员和保护神 三级网络技术考试经验 双报到网络安全进社区 post值保存数据库 规格数据的数据库设计 手机体检软件开发 快递公司服务器异常是怎么回事 tnt服务器 北京风禾讯驰网络技术 软件开发程序员保密合同 哪些数据库可以查同义词 西安app软件开发定制 部队信息网络安全 智能互联网高科技数学 新版本连接不到服务器怎么办 新建数据库 库名为学号姓名 明日之后秋日森林区服务器 传奇服务器挂安全狗到底有没有用 计算机网络安全属于什么门类 做软件开发的会需要到短信吗 hp服务器750w改可调电源 数据库 表名是什么意思 目前服务器单条内存条最大多大 北京风禾讯驰网络技术 维宏软件开发商密码 什么是技电网络技术 任务计划程序安全数据库在哪 郑州网络技术公司有哪些 中国国家统计局失业率数据库 pda无线连接数据库
0