如何理解Mutation Annotation Format格式

发布时间:2021-11-22 17:52:30 作者:柒染
来源:亿速云 阅读:217

这篇文章给大家介绍如何理解Mutation Annotation Format格式,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。

Mutation Annotation Format, 简称MAF, 是由TCGA制定的一种文件格式,用来存储突变注释信息。在TCGA中,对于突变数据有以下四种类型

如何理解Mutation Annotation Format格式

  1. Annotated Somatic Mutation, 体细胞突变的注释文件,格式为VCF, 采用VEP软件进行注释,文件后缀为vep.vcf.gz

  2. Raw Simple Somatic Mutation, 体细胞突变的原始文件,格式为VCF, 文件后缀为vcf.gz

  3. Aggregated Somatic Mutation, protected的突变注释文件,需要账号和权限才可以下载,格式为MAF, 文件后缀为maf.gz

  4. Masked Somatic Mutation, open access的突变注释文件,免费下载的,格式为MAF, 文件后缀为maf.gz


在TCGA中,VCF通常用于记录单个样本的体细胞突变相关结果,MAF用于整合所有样本的体细胞突变注释结果,所以称MAF格式为project-level, 根据数据的开放性,又分为protected和open access, 其中open access就是我们可以直接下载得到的MAF文件, 以乳腺癌为例,在TCGA中提供了4个MAF文件

如何理解Mutation Annotation Format格式

对应4个不同的体细胞突变calling软件,每个文件中包含了1044个样本的体细胞SNV注释结果。

MAF和VCF类似,也是一个纯文本的格式,由\t分隔的许多列构成,从GDC下载的MAF文件的截图如下

如何理解Mutation Annotation Format格式

#开头的为注释行,其他部分为正文,每一列有一个固定的表头, 完整的MAF共有100多列,在实际处理中,我们可能没有这么多列的信息,常用的几列解释如下

  1. column1, Hugo_Symbol, 由HUGO提供的gene  symbol, 表示SNV所在的基因名称

  2. column 2,Entrez_Gene_id, SNV所在基因的entrez  id, 如果没有对应的基因,则用0表示

  3. column 4,NCBI_Build, snv calling时使用的参考基因组版本

  4. column5,Chromsome, SNV所在的染色体

  5. column6,Start_Position, SNV在染色体上的起始位置

  6. column7,End_Position,SNV在染色体上的终止位置

  7. column9,Variant_Classification, SNV位点的分类,Missense_Mutation,Nonsense_Mutation等类别,分类的依据为SNV对翻译的影响

  8. column10,Variant_Type,  SNV位点的类型,比如SNP, INS,DEl等类型

  9. column11,Reference_Allel, 参考基因组上的allel

  10. column12,Tumor_Seq_Allel1, 肿瘤样本中该位点对应的主等位基因

  11. column13,Tumor_Seq_Allel2,肿瘤样本中该位点对应的次等位基因

  12. column16,Tumor_Sample_Barcode, 肿瘤样本的barcode

  13. column17,Tumor_Normal_Barcode,配对的正常样本的barcode


每一列的详细含义见如下链接

https://docs.gdc.cancer.gov/Data/File_Formats/MAF_Format/

MAF是专门针对human定义的一种文件格式,通过一个文件就可以包含所有样本的SNV和对应的注释信息,对于下游分析而言,非常的方便。在实际使用中, 对于VCF文件,可以通过vcf2maf将其转换为MAF格式,在后续文章中会具体介绍该软件的用法。

关于如何理解Mutation Annotation Format格式就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。

推荐阅读:
  1. 深入理解Java:注解(Annotation)自定义注解入门
  2. 深入理解Spring MVC的数据转换

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

maf

上一篇:IARC TP53数据库的示例分析

下一篇:c语言怎么实现含递归清场版扫雷游戏

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》