您好,登录后才能下订单哦!
这篇文章给大家分享的是有关SSRIT是什么工具的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。
微卫星microsatellite, 又叫做简单重复序列(simple sequence repeats, SSR)或者短串联重复序列(short tandem repeats, STR), 指的是以2到10bp的短序列为单位,重复出现多次所构成的DNA序列。
重复的最小单位称之为motif, 示例如下
agagagagagag
上述片段就是一段SSR序列,motif为ag, 重复出现了6次。
微卫星DNA种类多,分布广,在基因组中平均50bp就有一个重复序列;在不同种族,不同人群中重复单位和重复次数都大不相同,构成了SSR遗传多态性。
SSRIT是一款识别简单重复系列的软件,官网如下:
http://archive.gramene.org/db/markers/ssrtool
该软件的官网提供了在线服务,用法如下
参数a用于选择motif的最小长度,可选范围为2到10bp; 参数b用于选择最小重复次数,建议最小重复次数为5以上。
在文本框中,输入fasta格式的序列,然后点击右下角的FIND SSRs
提交即可。
输出结果如下
第一列为SSR区域的ID,由序列标识符和数字编号构成,第二列为Motif的碱基序列,第三列为重复次数,第四列和第五列对应SSR区域的起始和终止位置,第六列为输入序列的总长度。
也可以下载脚本本地运行,安装过程如下
wget ftp://ftp.gramene.org/pub/gramene/archives/software/scripts/ssr.pl
该软件采用perl语言开发,直接下载对应的perl脚本就可以了,这个perl脚本写的是比较简陋的,并没有提供帮助文档之类的信息。从源代码可以看出,用法如下
perl ssr.pl input.fasta > ssr.txt
只需要提供fasta格式的输入文件就可以了,一次可以提供多个fasta文件,示例文件如下
>seq1 agagattaggatcgatcgcgctctctctctctctctcgatcgagatcgat ggccatcatcatcatcatcattgagatatagcgcgatatcgagagatctc agaatagatatcgcgctatagagagatcgagagagagtaga >seq2 agagataggaatatgagatagcgggggggggggggcgctatacgcgctcg gagagagatctctctctctcttatagagatcgatcgactagctagatata agactcactcactcactcactcactcagcgcgat
输出结果通过重定向保存在ssr.txt
文件中,该文件的内容如下
seq1 1 3 cat 6 54 71 141 seq2 1 4 actc 6 103 126 134
输出内容和在线服务基本一致,第2列和第三列不需要看。需要注意的是,同样的输入文件,在线服务识别到了4个SSR区域,而本地版只识别到了2个,这个是因为参数设定不同。
本地版的motif长度和重复序列次数只能通过修改源代码实现,对应代码如下
my @specs = ([2,9], #dinucl. with >= 9 repeats [3,6], #trinucl. with >= 6 repeats [4,5]); #tetranucl. with >= 5 repeats
默认情况下,对于2bp的motif, 要求最小重复次数为9次,ct
这个motif只出现了8次,所以过滤掉了,如果想要和官网保持一致,可以修改源代码,然后再次运行就可以了。
感谢各位的阅读!关于“SSRIT是什么工具”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。