FusionMap中怎么检测融合基因

发布时间：2021-08-12 16:53:15 作者：Leah
来源：亿速云阅读：218

FusionMap中怎么检测融合基因

引言

融合基因（Fusion Gene）是指两个不同基因的部分序列通过染色体易位、倒位、插入等重排事件连接在一起，形成一个新的嵌合基因。融合基因在癌症中尤为常见，它们可以导致基因功能的改变，从而促进肿瘤的发生和发展。因此，检测融合基因对于癌症的诊断、治疗和预后评估具有重要意义。

FusionMap是一款专门用于检测融合基因的生物信息学工具。它通过分析RNA测序（RNA-Seq）数据，识别潜在的融合基因事件。本文将详细介绍如何在FusionMap中检测融合基因，包括数据准备、软件安装、运行参数设置、结果解读等方面。

1. 数据准备

1.1 RNA-Seq数据

FusionMap的输入数据是RNA-Seq测序数据，通常以FASTQ格式存储。RNA-Seq数据可以通过高通量测序平台（如Illumina、Ion Torrent等）获得。为了确保检测的准确性，建议使用高质量的RNA-Seq数据，并且测序深度应足够高（通常建议每个样本至少50M reads）。

1.2 参考基因组和注释文件

FusionMap需要参考基因组序列和基因注释文件来辅助融合基因的检测。常用的参考基因组包括人类基因组（如hg19、hg38）和小鼠基因组（如mm10）。基因注释文件通常以GTF或GFF格式存储，包含了基因的位置、外显子、内含子等信息。

2. 软件安装

2.1 下载FusionMap

FusionMap可以从其官方网站或GitHub仓库下载。下载后解压缩到本地目录。

wget https://github.com/FusionMap/FusionMap/releases/download/v1.0/FusionMap_v1.0.tar.gz
tar -zxvf FusionMap_v1.0.tar.gz

2.2 安装依赖软件

FusionMap依赖于一些外部软件和库，如Bowtie2、SAMtools、BEDTools等。在运行FusionMap之前，需要确保这些软件已正确安装并配置好环境变量。

# 安装Bowtie2
sudo apt-get install bowtie2

# 安装SAMtools
sudo apt-get install samtools

# 安装BEDTools
sudo apt-get install bedtools

2.3 配置FusionMap

在FusionMap的安装目录下，找到config.txt文件，编辑该文件以配置参考基因组和基因注释文件的路径。

# 编辑config.txt
nano config.txt

# 设置参考基因组路径
REFERENCE_GENOME=/path/to/reference_genome.fa

# 设置基因注释文件路径
GENE_ANNOTATION=/path/to/gene_annotation.gtf

3. 运行FusionMap

3.1 基本命令

FusionMap的基本运行命令如下：

./FusionMap -i input.fastq -o output_dir

其中，-i参数指定输入FASTQ文件，-o参数指定输出目录。

3.2 参数设置

FusionMap提供了多种参数来优化融合基因的检测。以下是一些常用的参数：

-t：线程数，默认为1。可以根据计算资源的可用性增加线程数以加快运行速度。
-m：最小支持reads数，默认为2。增加该值可以减少假阳性，但可能会漏检一些低丰度的融合基因。
-d：最大插入片段长度，默认为500。该参数用于控制融合基因的检测范围。

./FusionMap -i input.fastq -o output_dir -t 8 -m 3 -d 1000

3.3 运行示例

假设我们有一个RNA-Seq数据文件sample.fastq，参考基因组为hg19.fa，基因注释文件为hg19.gtf，我们可以按照以下步骤运行FusionMap：

# 配置config.txt
echo "REFERENCE_GENOME=/path/to/hg19.fa" > config.txt
echo "GENE_ANNOTATION=/path/to/hg19.gtf" >> config.txt

# 运行FusionMap
./FusionMap -i sample.fastq -o output_dir -t 8 -m 3 -d 1000

4. 结果解读

4.1 输出文件

FusionMap运行完成后，会在指定的输出目录下生成多个文件，主要包括：

fusion_candidates.txt：包含所有检测到的融合基因候选列表。
fusion_reads.bam：包含支持融合基因的reads的BAM文件。
fusion_events.bed：以BED格式存储的融合基因事件。

4.2 融合基因候选列表

fusion_candidates.txt文件是FusionMap的主要输出文件，包含了所有检测到的融合基因候选。每一行代表一个融合基因候选，格式如下：

GeneA    GeneB    ChrA    PosA    ChrB    PosB    StrandA    StrandB    ReadsCount

GeneA和GeneB：融合基因的两个伙伴基因。
ChrA和ChrB：伙伴基因所在的染色体。
PosA和PosB：融合位点在染色体上的位置。
StrandA和StrandB：伙伴基因的链方向。
ReadsCount：支持该融合基因的reads数。

4.3 结果过滤

为了减少假阳性，通常需要对fusion_candidates.txt中的结果进行过滤。常见的过滤标准包括：

ReadsCount：选择支持reads数大于某个阈值（如5）的融合基因。
基因功能：选择已知与癌症相关的基因。
融合位点：选择位于基因外显子区域的融合位点。

4.4 可视化

FusionMap还提供了可视化工具，可以将检测到的融合基因在基因组浏览器中展示。通过加载fusion_events.bed文件，可以直观地查看融合基因的位置和结构。

5. 案例分析

5.1 案例背景

假设我们有一个来自肺癌患者的RNA-Seq数据，希望通过FusionMap检测潜在的融合基因，以辅助诊断和治疗。

5.2 数据准备

我们下载了患者的RNA-Seq数据lung_cancer.fastq，并准备了人类参考基因组hg19.fa和基因注释文件hg19.gtf。

5.3 运行FusionMap

按照上述步骤配置和运行FusionMap：

# 配置config.txt
echo "REFERENCE_GENOME=/path/to/hg19.fa" > config.txt
echo "GENE_ANNOTATION=/path/to/hg19.gtf" >> config.txt

# 运行FusionMap
./FusionMap -i lung_cancer.fastq -o lung_cancer_output -t 8 -m 3 -d 1000

5.4 结果解读

运行完成后，我们查看fusion_candidates.txt文件，发现一个高置信度的融合基因候选：

EML4    ALK    chr2    42400000    chr2    29400000    +    -    15

该融合基因涉及EML4和ALK两个基因，支持reads数为15。通过查阅文献，我们发现EML4-ALK融合基因在非小细胞肺癌中较为常见，并且已有针对该融合基因的靶向药物。

5.5 结果验证

为了验证该融合基因的真实性，我们使用PCR和Sanger测序对患者样本进行了验证，结果证实了EML4-ALK融合基因的存在。

6. 总结

FusionMap是一款强大的融合基因检测工具，能够从RNA-Seq数据中高效地识别潜在的融合基因事件。通过合理的数据准备、参数设置和结果解读，FusionMap可以为癌症研究和临床诊断提供重要的分子生物学信息。然而，融合基因的检测仍然面临假阳性和假阴性的挑战，因此建议结合其他实验方法（如PCR、FISH等）对FusionMap的结果进行验证。

参考文献

FusionMap官方文档：https://github.com/FusionMap/FusionMap
RNA-Seq数据分析指南：https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3530905/
融合基因在癌症中的作用：https://www.nature.com/articles/nrc3947

通过本文的介绍，相信读者已经对如何在FusionMap中检测融合基因有了全面的了解。希望本文能够为从事癌症研究和临床诊断的科研人员提供有价值的参考。

FusionMap中怎么检测融合基因

FusionMap中怎么检测融合基因

引言

1. 数据准备

1.1 RNA-Seq数据

1.2 参考基因组和注释文件

2. 软件安装

2.1 下载FusionMap

2.2 安装依赖软件

2.3 配置FusionMap

3. 运行FusionMap

3.1 基本命令

3.2 参数设置

3.3 运行示例

4. 结果解读

4.1 输出文件

4.2 融合基因候选列表

4.3 结果过滤

4.4 可视化

5. 案例分析

5.1 案例背景

5.2 数据准备

5.3 运行FusionMap

5.4 结果解读

5.5 结果验证

6. 总结

参考文献

相关阅读