如何使用CIRI识别环状RNA

发布时间:2021-11-10 15:57:38 作者:柒染
来源:亿速云 阅读:200

本篇文章为大家展示了如何使用CIRI识别环状RNA,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。

在最初的环状RNA研究中,认为环状RNA都是由exon通过反向剪切构成的,称之为exonic circRNA,只有这样的环状RNA能够由PCR反应验证出来的。

CIRI是一款环状RNA检测软件,通过该软件的预测结果,学者第一次用实验验证出了intronic circRNA和intergenic circRNA。该软件操作简便,准确度高,是非常流行的一款环状RNA检测软件。

该软件至少需要两个输入文件,基因组的fasta序列和测序数据比对产生的sam文件,需要注意的是,输入的sam文件必须是由bwa-mem算法比对产生的 。分析的pipeline示意如下

如何使用CIRI识别环状RNA

对于输入的sam文件,需要经过两次扫描,在第一次扫描时,根据双端数据的比对情况筛选候选的环状RNA,这一步通过判断SAM文件中CIGAR那一列的值来实现,本质上是检测覆盖环状RNA连接点处的junction reads,根据测序读长和连接点处包含的基因组区域的特征,分成以下3种模型

如何使用CIRI识别环状RNA

图A表示junction read只覆盖了起始外显子和终止外显子的部分序列,这两部分reads在基因组上的比对位置是相反的,绝大部分的环状RNA都符合这种模型。

图B表示junction read除了覆盖了起始外显子和终止外显子的两部分序列外,还覆盖了中间的一个外显子的部分序列,这种情况下reads可以分成3个部分比对到基因组上。

图C表示junction read除了覆盖了整个环状RNA外,还重复又读了一部分序列,这个只有当环状RNA的序列长度小于测序读长时才可能出现。

该软件将以上3种模型定义为paired chiastic clipping signals,简称PCC信号,如果一条reads比对情况符合以上任意一种,就认为该reads是一条环状RNA的junction reads。

为了提高准确性,识别到junciton reads之后,还会结合双端序列比对的质量paired end mapping即PEM和GT-AG保守的剪切位点进行过滤,示意图如下

如何使用CIRI识别环状RNA

只保留比对质量较高,且头尾符合AG-GT剪切信号的junciton reads进入下游分析,在第二次扫描SAM文件的过程中,通过动态规划算法给出最终的环状RNA预测结果,如果提供了GTF文件,还会对环状RNA进行注释。

该软件的使用步骤如下

1. bwa比对参考基因组

代码如下

bwa mem \
-T 19 \
-t 5 hg19_index \
R1.fastq.gz R2.fastq.gz \
> align.sam
2. 运行CIRI
CIRI2.pl  \
-T 20 \
-F hg19.fa \
-A hg19.gtf \
-I align.sam \
-O circRNA.xls

输出结果如下所示

如何使用CIRI识别环状RNA

在后续验证时,可以挑选表达量较高的来验证,在软件对应的文章中,挑选了junction reads数大于5的环状RNA来进行验证。

上述内容就是如何使用CIRI识别环状RNA,你们学到知识或技能了吗?如果还想学到更多技能或者丰富自己的知识储备,欢迎关注亿速云行业资讯频道。

推荐阅读:
  1. 如何使用Opencv识别颜色
  2. 转录组RNA-Seq如何使用docker+bioconda搭建分析环境

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

上一篇:怎么解决Oracle执行expdp写入NFS文件系统提示ORA-39001错误

下一篇:Django中的unittest应用是什么

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》