如何使用GDC在线查看TCGA数据

发布时间:2021-07-24 10:21:18 作者:chen
来源:亿速云 阅读:372

如何使用GDC在线查看TCGA数据

引言

癌症基因组图谱(The Cancer Genome Atlas, TCGA)是一个由美国国家癌症研究所(NCI)和国家人类基因组研究所(NHGRI)共同发起的项目,旨在通过基因组学技术对多种癌症类型进行全面的分子特征分析。TCGA项目生成了大量的多组学数据,包括基因组、转录组、表观基因组和蛋白质组数据。这些数据为癌症研究提供了宝贵的资源。

为了便于研究人员访问和分析这些数据,NCI开发了基因组数据共享(Genomic Data Commons, GDC)平台。GDC不仅提供了TCGA数据的集中存储和访问,还提供了多种工具和接口,帮助用户在线查看、下载和分析数据。本文将详细介绍如何使用GDC在线查看TCGA数据。

GDC平台简介

GDC平台是一个集成的数据共享平台,旨在为研究人员提供癌症基因组数据的统一访问点。GDC不仅包含TCGA数据,还包含其他癌症研究项目的数据,如TARGET(Therapeutically Applicable Research to Generate Effective Treatments)和CGCI(Cancer Genome Characterization Initiative)。

GDC平台的主要功能包括:

  1. 数据浏览:用户可以通过GDC数据门户浏览和搜索TCGA数据。
  2. 数据下载:用户可以选择特定的数据集并下载到本地进行分析。
  3. 数据分析:GDC提供了一些在线分析工具,如数据可视化、基因表达分析等。
  4. 数据提交:研究人员可以将自己的数据提交到GDC,供其他研究人员使用。

如何使用GDC在线查看TCGA数据

1. 访问GDC数据门户

首先,打开浏览器并访问GDC数据门户的官方网站:https://portal.gdc.cancer.gov/。GDC数据门户是GDC平台的主要入口,用户可以通过该门户访问和浏览TCGA数据。

2. 浏览和搜索数据

在GDC数据门户的主页上,您可以看到一个搜索栏和一些数据分类选项。您可以通过以下几种方式浏览和搜索TCGA数据:

2.1 按项目浏览

在主页上,您可以看到“Projects”选项。点击“Projects”后,您将看到所有可用的项目列表,包括TCGA项目。点击TCGA项目,您将进入该项目的详细页面,可以看到该项目下的所有病例、样本和文件。

2.2 按数据类型浏览

在主页上,您还可以看到“Data Categories”选项。点击“Data Categories”后,您将看到所有可用的数据类型,如基因组、转录组、表观基因组等。选择您感兴趣的数据类型,GDC将显示该类型下的所有文件。

2.3 使用搜索栏

如果您已经知道您要查找的具体数据,可以直接在搜索栏中输入关键词进行搜索。例如,您可以输入特定的基因名称、癌症类型或病例ID,GDC将返回与您搜索条件匹配的结果。

3. 查看数据详情

在搜索结果或项目页面中,您可以点击特定的病例、样本或文件,查看其详细信息。GDC提供了丰富的数据元信息,包括病例的临床信息、样本的分子特征、文件的格式和大小等。

3.1 查看病例信息

点击一个病例后,您将进入该病例的详细页面。在这里,您可以查看该病例的临床信息,如诊断、治疗、生存状态等。您还可以查看该病例下的所有样本和文件。

3.2 查看样本信息

点击一个样本后,您将进入该样本的详细页面。在这里,您可以查看该样本的分子特征,如基因突变、基因表达、DNA甲基化等。您还可以查看该样本下的所有文件。

3.3 查看文件信息

点击一个文件后,您将进入该文件的详细页面。在这里,您可以查看文件的格式、大小、MD5校验和等信息。您还可以下载该文件到本地进行分析。

4. 下载数据

在查看数据详情后,如果您决定下载数据,可以按照以下步骤操作:

  1. 在文件详情页面,点击“Download”按钮。
  2. 系统将提示您选择下载方式。您可以选择直接下载或使用GDC Data Transfer Tool进行批量下载。
  3. 如果选择直接下载,文件将开始下载到您的本地计算机。
  4. 如果选择使用GDC Data Transfer Tool,您需要先安装该工具,然后按照提示进行操作。

5. 使用GDC分析工具

GDC不仅提供了数据浏览和下载功能,还提供了一些在线分析工具,帮助用户进行初步的数据分析。

5.1 数据可视化

GDC提供了多种数据可视化工具,如基因表达热图、突变频谱图等。您可以在数据详情页面找到这些工具,并使用它们对数据进行可视化分析。

5.2 基因表达分析

GDC还提供了基因表达分析工具,您可以选择特定的基因或基因集,查看其在不同样本中的表达水平。您还可以进行差异表达分析,比较不同组别之间的基因表达差异。

5.3 突变分析

GDC提供了突变分析工具,您可以选择特定的基因或突变类型,查看其在不同样本中的分布情况。您还可以进行突变频谱分析,比较不同组别之间的突变模式。

6. 使用GDC API进行高级分析

对于需要进行更高级分析的研究人员,GDC还提供了API接口。通过GDC API,您可以编程访问GDC数据,并进行自定义的数据分析和处理。

6.1 获取API访问权限

要使用GDC API,您需要先注册一个GDC账户,并获取API访问权限。您可以在GDC数据门户的“Developer”页面找到相关信息和文档。

6.2 使用API查询数据

GDC API支持多种查询方式,您可以通过API查询特定的病例、样本、文件或基因数据。API返回的数据格式为JSON,您可以将其导入到您的分析工具中进行进一步处理。

6.3 使用API下载数据

除了查询数据,GDC API还支持通过API下载数据。您可以通过API指定要下载的文件列表,并使用GDC Data Transfer Tool进行批量下载。

结论

GDC平台为研究人员提供了一个强大的工具,用于访问和分析TCGA数据。通过GDC数据门户,用户可以方便地浏览、搜索和下载TCGA数据,并使用GDC提供的在线分析工具进行初步的数据分析。对于需要进行更高级分析的研究人员,GDC API提供了编程访问数据的接口,支持自定义的数据分析和处理。

通过本文的介绍,相信您已经掌握了如何使用GDC在线查看TCGA数据的基本方法。希望这些信息能够帮助您在癌症研究中取得更多的进展。

推荐阅读:
  1. 如何进行TCGA数据库的分析
  2. 怎么用gdc-client批量下载TCGA数据

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

gdc

上一篇:webpack4中splitChunk插件有什么用

下一篇:如何使用TADbit识别拓扑关联结构域

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》