| 一种基于大规模基因树的物种树构建方法 |
| 赵磊; 李洪涛 ; 李德铢
|
| 2018-10-09
|
申请号 | CN201811173902.X
|
公开(公告)号 | CN109411021A
|
专利权人 | 中国科学院昆明植物研究所
|
公开日期 | 2019-03-01
|
摘要 | 本发明提供一种批量搜索大规模单或者低拷贝直系同源基因簇(orthologous gene clusters),并利用大规模基因树(gene trees)构建物种树(species trees)的方法。该方法综合运用了基于HMM的搜索直系同源基因的HAMSTR程序,基于多序列比对分析MAFFT程序和自动提取精确比对区域的TRIMAL程序,以及构建物种树RAxML,ASTRAL‑II和MP‑EST程序,并结合Perl脚本语言编程等方法实现整个数据流过程。实验证明,本发明所提供的批量搜索大规模单或者低拷贝直系同源基因簇,并利用大规模基因树构建物种树的方法与系统,精确度高,速度快,实现了批量化、自动化。 |
其他摘要 | 1.批量搜索大规模单或者低拷贝直系同源基因簇,并利用大规模基因树构建物种树的方法,其特征在于该方法包括如下步骤:收集或者测序每个物种转录组或者基因组数据,这些数据一般包括CDS和蛋白质序列,命名分别为XXX_pep.fa,XXX_cds.fa;接着,用HaMStR搜索单或者低拷贝直系同源基因簇,运行命令和相关参数为:perl./hamstrsearch_local‑hmmer3.v8.pl‑sequence_file=XXX_pep.fa‑protein‑taxon=XXX‑hmmset=magnoliophyta_hmmer3‑representative‑relaxed‑eval_limit=0.01‑blast_NOCPU=8–rbh,从而已完成每个物种的直系同源基因的搜索;为形成相应直系同源基因簇,便于大规模的多序列比对,用Perl程序sub_print_orthology_HASH.pl把相应的基因合并成直系同源基因簇;用Perl程序mafft_alignment_orthology_shell.pl把多序列比对程序MAFF集成在相应的Perl脚本中,方便进行大规模的多序列比对;用Perl程序trimal_alignment_orthology_shell.pl删除多序列比对的结果中排列不好的区域;用Perl程序Find_RAxML_tree_CDS_Protein_MPEST_shell.pl把建树程序RAxML集成在Perl脚本中,方便进行大规模的单基因树构建;最后,用Perl程序Generate_MPEST_GeneTress_shell.pl和Generate_ASTRAL_GeneTress_shell.pl生成MPEST和ASTRAL‑II要求的基因树输入格式,完成基于单基因树构建物种树。 |
文献类型 | 专利
|
条目标识符 | http://ir.kib.ac.cn/handle/151853/67759
|
专题 | 中国西南野生生物种质资源库
|
作者单位 | 中国科学院昆明植物研究所
|
第一作者单位 | 中国科学院昆明植物研究所
|
推荐引用方式 GB/T 7714 |
赵磊,李洪涛,李德铢. 一种基于大规模基因树的物种树构建方法[P]. 2018-10-09.
|
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论