零基础多物种间共线性分析

首先非常感谢Cj大神开发出来的TBtools生信工具,为生信分析做图带来了极大的便利。作为生信小白,在做多物种间共线性分析时,尝试了多种方法,苦于没有计算机基础,一直没能完成,最后锁定TBtools的零命令行作图,几经摸索,终于成功,贼开心。

零基础多物种间共线性分析,第1张
话不多说先上效果图

一、准备工作

1.下载各个物种的.gff文件和基因组序列文件


零基础多物种间共线性分析,第2张
示例

数据下载地址:[http://plants.ensembl.org/info/website/ftp/index.html]

零基础多物种间共线性分析,第3张
1

零基础多物种间共线性分析,第4张
2:右击,复制链接,用迅雷下载比较快

零基础多物种间共线性分析,第5张
3

2.工具TBtools:欢迎加入开发作者的QQ交流学习群(553679029),先看群公告哈。

二、将文件进行ID prefix,统一染色体名称。

零基础多物种间共线性分析,第6张
没统一的草图,染色体前缀由系统命名

打开TBtools

零基础多物种间共线性分析,第7张
1gff文件进行ID prefix

零基础多物种间共线性分析,第8张
2

零基础多物种间共线性分析,第9张
3.fa文件进行ID prefix

零基础多物种间共线性分析,第10张
4:注意两次输入的字符必须一样。例图中是:AT-
按步骤操作完成后,每个物种得到新的.gff文件和.fa文件,用于后续的共线性分析。

三、确定物种间的亲缘远近关系

目的:给各个物种安排的排序位置,例如我做的5个物种拟南芥、大豆、水稻、小麦和玉米,其中水稻、小麦和玉米属于禾本科植物,这三个物种之间的共线性关系自然是比较好的,但是具体的怎末连线还是不清楚,当然可以通过文献查找来确定,这里为了保险起见,我决定将所有物种两两组合,看共线性关系,先做两物种间共线性,再来排列。

两个物种间的共线性,请参考:https://www.jianshu.com/p/6c5a5a2d8fa7

注意:
1:OnestepMCscanX的比对时间因物种而已,比如小麦这种超大基因组的物种,我用小笔记本跑了两天,start后就静静等待了,建议最好多用几台电脑。
2:两物间共线性分析时,用ID prefix后的文件,只是链接里我用的原始文件。

零基础多物种间共线性分析,第11张
按照高亮基因共线性条目多少进行排序(水稻做了籼稻和粳稻的可以忽视,5个物种也就10种组合)

结果:确定这几个物种的前后顺序为拟南芥、大豆、水稻、小麦、玉米,得到两两之间的比对结果文件。

四、比对文件合并与修改

零基础多物种间共线性分析,第12张
多物种共线性需要用到的文件
零基础多物种间共线性分析,第13张
1

零基础多物种间共线性分析,第14张
2

零基础多物种间共线性分析,第15张
3:所需文件合并结果

零基础多物种间共线性分析,第16张
4:查看合并文件,将文件拖入即可

零基础多物种间共线性分析,第17张
5:将碎片删除,将染色体保留并排序

零基础多物种间共线性分析,第18张
6:表示图片颜色的数字可以删除

零基础多物种间共线性分析,第19张
7:整理自己的Highlight基因ID,依旧是全英状态下输入

零基础多物种间共线性分析,第20张
8:可视化啦

零基础多物种间共线性分析,第1张
9:最终图片

零基础多物种间共线性分析,第22张
10:我将颜色数字代码去除的亚子

完结撒花,最费时间的还是两物种间比对找远近关系,只要按照步骤来,很快就可以做出来的,加油!

本文经用户投稿或网站收集转载,如有侵权请联系本站。

发表评论

0条回复

    作者信息

    标签TAG

    相关文章