怎么使用EXCAVATOR2检测WES的CNV

发布时间:2021-11-10 10:09:09 作者:柒染
来源:亿速云 阅读:201

怎么使用EXCAVATOR2检测WES的CNV

引言

全外显子测序(Whole Exome Sequencing, WES)是一种高通量测序技术,主要用于检测基因组中的外显子区域。外显子是编码蛋白质的DNA序列,因此WES在疾病相关基因的发现和诊断中具有重要应用。然而,WES数据不仅可以用于检测单核苷酸变异(SNV)和小插入/缺失(indel),还可以用于检测拷贝数变异(Copy Number Variation, CNV)。CNV是指基因组中某些区域的拷贝数增加或减少,这些变异在许多疾病中起着重要作用。

EXCAVATOR2是一个专门用于从WES数据中检测CNV的工具。它通过分析测序深度(read depth)来识别CNV,并且具有较高的灵敏度和特异性。本文将详细介绍如何使用EXCAVATOR2来检测WES数据中的CNV。

1. 安装EXCAVATOR2

1.1 系统要求

EXCAVATOR2是一个基于Perl的工具,因此需要在Linux或Unix系统上运行。确保系统中已安装以下软件:

1.2 下载和安装

  1. 从EXCAVATOR2的GitHub仓库下载最新版本:
   git clone https://github.com/PhanstielLab/EXCAVATOR2.git
  1. 进入EXCAVATOR2目录:
   cd EXCAVATOR2
  1. 安装所需的Perl模块:
   cpanm --installdeps .
  1. 安装所需的R包:
   Rscript install_packages.R

2. 准备输入文件

2.1 BAM文件

EXCAVATOR2需要输入的BAM文件是经过比对和排序的。可以使用BWA或Bowtie2等工具将测序数据比对到参考基因组,并使用SAMtools进行排序和索引。

samtools sort -o sorted.bam input.bam
samtools index sorted.bam

2.2 目标区域文件

EXCAVATOR2需要一个BED格式的目标区域文件,该文件定义了WES捕获的目标区域。通常可以从测序服务提供商处获取该文件。

2.3 样本配置文件

EXCAVATOR2需要一个样本配置文件,该文件定义了每个样本的BAM文件路径和目标区域文件路径。配置文件格式如下:

/path/to/sample1.bam /path/to/target_regions.bed
/path/to/sample2.bam /path/to/target_regions.bed

3. 运行EXCAVATOR2

3.1 运行预处理步骤

EXCAVATOR2的预处理步骤包括计算每个样本的测序深度和GC含量校正。

perl EXCAVATOR2.pl PrepareAnalyses \
    --target /path/to/target_regions.bed \
    --bam /path/to/sample1.bam \
    --output /path/to/output_dir \
    --processors 8

3.2 运行CNV检测

预处理步骤完成后,可以运行CNV检测步骤。EXCAVATOR2提供了多种检测模式,包括单样本模式、配对样本模式和群体模式。

3.2.1 单样本模式

单样本模式用于检测单个样本中的CNV。

perl EXCAVATOR2.pl Analysis \
    --target /path/to/target_regions.bed \
    --bam /path/to/sample1.bam \
    --output /path/to/output_dir \
    --processors 8 \
    --mode single

3.2.2 配对样本模式

配对样本模式用于检测肿瘤-正常配对样本中的CNV。

perl EXCAVATOR2.pl Analysis \
    --target /path/to/target_regions.bed \
    --bam /path/to/tumor.bam \
    --control /path/to/normal.bam \
    --output /path/to/output_dir \
    --processors 8 \
    --mode paired

3.2.3 群体模式

群体模式用于检测多个样本中的CNV。

perl EXCAVATOR2.pl Analysis \
    --target /path/to/target_regions.bed \
    --bam /path/to/sample_list.txt \
    --output /path/to/output_dir \
    --processors 8 \
    --mode population

3.3 结果解释

EXCAVATOR2的输出结果包括CNV的检测结果和可视化图表。CNV检测结果通常以BED格式存储,包含每个CNV的染色体位置、起始位置、终止位置、拷贝数状态等信息。

4. 结果验证和后续分析

4.1 结果验证

EXCAVATOR2检测到的CNV可以通过其他实验方法(如qPCR或FISH)进行验证。此外,还可以使用其他CNV检测工具(如CNVkit或Control-FREEC)进行交叉验证。

4.2 后续分析

检测到的CNV可以进一步用于功能注释和通路分析。可以使用DAVID或KEGG等工具对CNV所在的基因进行功能注释,并分析其在疾病中的潜在作用。

5. 常见问题及解决方案

5.1 测序深度不足

如果测序深度不足,可能会导致CNV检测的灵敏度下降。建议增加测序深度或使用更高覆盖率的WES panel。

5.2 GC含量偏差

GC含量偏差可能会影响CNV检测的准确性。EXCAVATOR2提供了GC含量校正功能,可以在预处理步骤中启用。

5.3 样本间批次效应

样本间的批次效应可能会导致假阳性或假阴性结果。建议在分析前进行批次效应校正,或使用配对样本模式进行分析。

6. 总结

EXCAVATOR2是一个强大的工具,能够从WES数据中检测CNV。通过合理的预处理和分析步骤,可以有效地识别基因组中的拷贝数变异,并为疾病研究提供重要线索。希望本文能够帮助读者更好地理解和使用EXCAVATOR2进行CNV检测。

参考文献

  1. Magi, A., Tattini, L., Cifola, I., D’Aurizio, R., Benelli, M., Mangano, E., … & Gensini, G. F. (2013). EXCAVATOR: detecting copy number variants from whole-exome sequencing data. Genome biology, 14(10), R120.
  2. Li, H., & Durbin, R. (2009). Fast and accurate short read alignment with Burrows-Wheeler transform. Bioinformatics, 25(14), 1754-1760.
  3. Quinlan, A. R., & Hall, I. M. (2010). BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics, 26(6), 841-842.

通过以上步骤,您可以成功使用EXCAVATOR2从WES数据中检测CNV。希望本文对您的研究有所帮助!

推荐阅读:
  1. 使用phonegap怎么检测网络的状态
  2. 如何使用JavaScript 检测文件的类型

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

wes cnv

上一篇:redis数据备份和迁移工具redis-dump如何安装使用

下一篇:Django中的unittest应用是什么

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》